#Latență | Breaking 24

Gradium lansează stt-translate și s2s-translate: modele de traducere vocală în timp real care depășesc gpt-realtime-translate în acuratețe și latență

Gradium a lansat două modele de traducere vocală în timp real, stt-translate și s2s-translate, care comprimă lanțul tradițional de trei modele în doar două etape, oferind o acuratețe și o latență mai bune decât gpt-realtime-translate și gemini-3.5-live-translate, plus selecție și clonare a vocii.

🕒 1 săptămâni în urmă

AI

Perplexity AI lansează open-source un tokenizer Unigram care reduce latența p50 de 5 ori față de crate-ul Hugging Face

Perplexity AI a lansat open-source un tokenizer Unigram care oferă o latență p50 de cinci ori mai mică decât Hugging Face tokenizers, promițând să accelereze procesarea textului în modelele de limbaj.

🕒 1 luni în urmă

AI

Salesforce AI Research lansează VoiceAgentRAG: Un Router Dual-Agent de Memorie care Reduce Latența Recuperării RAG Vocal cu 316x

Salesforce AI Research a dezvoltat VoiceAgentRAG, un sistem revoluționar cu router dual-agent de memorie care reduce latența recuperării informațiilor în sistemele RAG vocale de 316 ori. Tehnologia utilizează agenți inteligenți de rutare și optimizare pentru a anticipa necesitățile informaționale și a accelera accesul la date, eliminând pauzele inconfortabile din conversațiile vocale cu AI și deschizând noi posibilități pentru asistenți virtuali enterprise în timp real.

🕒 3 luni în urmă

Filtrează articolele

Subiect: #Latență

Gradium lansează stt-translate și s2s-translate: modele de traducere vocală în timp real care depășesc gpt-realtime-translate în acuratețe și latență

Perplexity AI lansează open-source un tokenizer Unigram care reduce latența p50 de 5 ori față de crate-ul Hugging Face

Salesforce AI Research lansează VoiceAgentRAG: Un Router Dual-Agent de Memorie care Reduce Latența Recuperării RAG Vocal cu 316x