Summitul Trump-Xi a lăsat impresia că s-ar putea ajunge la un acord privind exporturile de cipuri Nvidia H200 în China, dar realitatea este alta: licențele americane sunt aprobate, însă Beijingul blochează livrările, forțând companiile chineze să treacă la soluții interne precum Huawei Ascend. Un pariu strategic care redefinește lanțurile de aprovizionare AI.
NVIDIA a dezvoltat o metodologie de pre-antrenare pe 4 biți folosind formatul NVFP4, validată pe un model hibrid Mamba-Transformer de 12 miliarde de parametri antrenat pe 10 trilioane de tokeni. Rezultatele arată o acuratețe aproape identică cu cea a antrenării pe 8 biți (62,58% vs 62,62% pe MMLU-Pro), deschizând calea către o reducere drastică a costurilor și consumului de energie în antrenarea modelelor AI.
NVIDIA a lansat SANA-WM, un model mondial open-source cu 2,6 miliarde de parametri, capabil să genereze videoclipuri de 720p de până la un minut pe un singur GPU. Articolul explică tehnologia, comparațiile cu Sora, aplicațiile și impactul asupra democratizării generării video.
Cerebras a strâns 5,5 miliarde de dolari în IPO, cu acțiuni la 185 de dolari, depășind estimările. Compania, rivală a Nvidia, a revenit la profit și atrage clienți precum OpenAI și AWS, marcând un moment crucial pentru piața cipurilor AI.
Sakana AI și NVIDIA au lansat TwELL, o tehnologie care accelerează inferența cu 20,5% și antrenamentul cu 21,9% pentru modelele de limbaj mari, folosind nuclee CUDA optimizate. Articolul explică cum funcționează, impactul și importanța acestei inovații.
NVIDIA a lansat cuda-oxide, un backend experimental de compilare care transformă kernel-uri SIMT scrise în Rust direct în PTX, deschizând calea către programarea GPU-urilor cu siguranța și performanța oferite de Rust.
NVIDIA a lansat Star Elastic, o metodă post-antrenare care înglobează trei modele de raționament (30B, 23B și 12B parametri) într-un singur checkpoint, reducând costurile de antrenare de 360 de ori și permițând rularea pe GPU-uri RTX. Controlul elastic al bugetului îmbunătățește acuratețea cu 16% și reduce latența de 1,9 ori.
Nvidia a investit peste 40 de miliarde de dolari în companii AI în 2026, inclusiv 30 de miliarde în OpenAI. Criticii vorbesc despre tranzacții circulare, dar analiștii văd o strategie de consolidare a dominației pe piața AI.
OpenAI, în parteneriat cu AMD, Broadcom, Intel, Microsoft și NVIDIA, lansează MRC (Multipath Reliable Connection), un protocol de rețea deschis care îmbunătățește performanța și reziliența clusterelor de antrenare AI, permițând distribuirea pachetelor pe sute de căi simultan și recuperarea în microsecunde după defecțiuni.
SAP achiziționează startup-ul german Prior Labs pentru a crea un laborator AI specializat pe date structurate, investind 1,16 miliarde de dolari. În același timp, compania blochează agenții AI neautorizați, dar aprobă NemoClaw de la Nvidia, într-o mișcare care redefinește peisajul enterprise AI.
Jensen Huang, CEO Nvidia, susține că inteligența artificială va crea un număr uriaș de locuri de muncă, contrazicând temerile legate de șomajul în masă. El argumentează că AI este cea mai bună șansă de reindustrializare a SUA și că automatizarea sarcinilor nu înseamnă neapărat înlocuirea posturilor.
Discuțiile exploratorii dintre LG și NVIDIA dezvăluie dependențele critice pentru implementarea AI-ului fizic: de la răcirea centrelor de date și roboți casnici cu inferență zero-latență, până la integrarea auto. Parteneriatul ar putea standardiza infrastructura pentru autonomia din lumea reală.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.