DeepSeek a lansat DSpark, un cadru de decodare speculativă care accelerează generarea de text per utilizator cu 57–85% față de MTP-1, fără pierderi de calitate. Folosește un draft paralel și un cap Markov pentru a reduce degradarea sufixelor, plus o verificare adaptivă în funcție de încărcarea GPU-ului. DeepSpec, setul de instrumente de antrenament, este open-source sub licență MIT.
EAGLE 3.1 este un algoritm de decodare speculativă care corectează deriva atenției în inferența modelelor de limbaj, reducând latența cu până la 60% și menținând calitatea textului generat.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.