Gradium a lansat două modele de traducere vocală în timp real, stt-translate și s2s-translate, care comprimă lanțul tradițional de trei modele în doar două etape, oferind o acuratețe și o latență mai bune decât gpt-realtime-translate și gemini-3.5-live-translate, plus selecție și clonare a vocii.
Perplexity AI a lansat open-source un tokenizer Unigram care oferă o latență p50 de cinci ori mai mică decât Hugging Face tokenizers, promițând să accelereze procesarea textului în modelele de limbaj.
Salesforce AI Research a dezvoltat VoiceAgentRAG, un sistem revoluționar cu router dual-agent de memorie care reduce latența recuperării informațiilor în sistemele RAG vocale de 316 ori. Tehnologia utilizează agenți inteligenți de rutare și optimizare pentru a anticipa necesitățile informaționale și a accelera accesul la date, eliminând pauzele inconfortabile din conversațiile vocale cu AI și deschizând noi posibilități pentru asistenți virtuali enterprise în timp real.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.