#NVIDIA - Pagină 4 | Breaking 24

AI

Afacerea Nvidia H200 cu China a supraviețuit summitului Trump-Xi – dar nu așa cum se aștepta nimeni

Summitul Trump-Xi a lăsat impresia că s-ar putea ajunge la un acord privind exporturile de cipuri Nvidia H200 în China, dar realitatea este alta: licențele americane sunt aprobate, însă Beijingul blochează livrările, forțând companiile chineze să treacă la soluții interne precum Huawei Ascend. Un pariu strategic care redefinește lanțurile de aprovizionare AI.

🕒 1 luni în urmă

NVIDIA revoluționează antrenarea modelelor AI: metodologie de pre-antrenare pe 4 biți cu NVFP4, validată pe un model hibrid Mamba-Transformer de 12 miliarde de parametri

NVIDIA a dezvoltat o metodologie de pre-antrenare pe 4 biți folosind formatul NVFP4, validată pe un model hibrid Mamba-Transformer de 12 miliarde de parametri antrenat pe 10 trilioane de tokeni. Rezultatele arată o acuratețe aproape identică cu cea a antrenării pe 8 biți (62,58% vs 62,62% pe MMLU-Pro), deschizând calea către o reducere drastică a costurilor și consumului de energie în antrenarea modelelor AI.

🕒 1 luni în urmă

AI

NVIDIA lansează SANA-WM: modelul mondial open-source cu 2,6 miliarde de parametri care generează videoclipuri de 720p la scară de minute pe un singur GPU

NVIDIA a lansat SANA-WM, un model mondial open-source cu 2,6 miliarde de parametri, capabil să genereze videoclipuri de 720p de până la un minut pe un singur GPU. Articolul explică tehnologia, comparațiile cu Sora, aplicațiile și impactul asupra democratizării generării video.

🕒 1 luni în urmă

AI

Cerebras strânge 5,5 miliarde de dolari și deschide sezonul IPO-urilor din 2026 cu un bang

Cerebras a strâns 5,5 miliarde de dolari în IPO, cu acțiuni la 185 de dolari, depășind estimările. Compania, rivală a Nvidia, a revenit la profit și atrage clienți precum OpenAI și AWS, marcând un moment crucial pentru piața cipurilor AI.

🕒 1 luni în urmă

AI

Sakana AI și NVIDIA lansează TwELL cu nuclee CUDA: accelerare cu 20,5% la inferență și 21,9% la antrenament pentru modelele de limbaj mari

Sakana AI și NVIDIA au lansat TwELL, o tehnologie care accelerează inferența cu 20,5% și antrenamentul cu 21,9% pentru modelele de limbaj mari, folosind nuclee CUDA optimizate. Articolul explică cum funcționează, impactul și importanța acestei inovații.

🕒 1 luni în urmă

AI

NVIDIA lansează cuda-oxide: un compilator experimental Rust-to-CUDA care compilează kernel-uri SIMT direct în PTX

NVIDIA a lansat cuda-oxide, un backend experimental de compilare care transformă kernel-uri SIMT scrise în Rust direct în PTX, deschizând calea către programarea GPU-urilor cu siguranța și performanța oferite de Rust.

🕒 1 luni în urmă

AI

NVIDIA lansează Star Elastic: un singur checkpoint care conține trei modele de raționament de 30B, 23B și 12B parametri, cu tăiere zero-shot

NVIDIA a lansat Star Elastic, o metodă post-antrenare care înglobează trei modele de raționament (30B, 23B și 12B parametri) într-un singur checkpoint, reducând costurile de antrenare de 360 de ori și permițând rularea pe GPU-uri RTX. Controlul elastic al bugetului îmbunătățește acuratețea cu 16% și reduce latența de 1,9 ori.

🕒 1 luni în urmă

AI

Nvidia a investit deja 40 de miliarde de dolari în acțiuni AI în acest an

Nvidia a investit peste 40 de miliarde de dolari în companii AI în 2026, inclusiv 30 de miliarde în OpenAI. Criticii vorbesc despre tranzacții circulare, dar analiștii văd o strategie de consolidare a dominației pe piața AI.

🕒 1 luni în urmă

OpenAI lansează MRC (Multipath Reliable Connection): Un nou protocol de rețea deschis pentru clusterele de antrenare AI la scară largă

OpenAI, în parteneriat cu AMD, Broadcom, Intel, Microsoft și NVIDIA, lansează MRC (Multipath Reliable Connection), un protocol de rețea deschis care îmbunătățește performanța și reziliența clusterelor de antrenare AI, permițând distribuirea pachetelor pe sute de căi simultan și recuperarea în microsecunde după defecțiuni.

🕒 1 luni în urmă

AI

SAP pariază 1,16 miliarde de dolari pe un laborator german de AI vechi de 18 luni și spune „da” lui NemoClaw

SAP achiziționează startup-ul german Prior Labs pentru a crea un laborator AI specializat pe date structurate, investind 1,16 miliarde de dolari. În același timp, compania blochează agenții AI neautorizați, dar aprobă NemoClaw de la Nvidia, într-o mișcare care redefinește peisajul enterprise AI.

🕒 1 luni în urmă

AI

Jensen Huang, CEO Nvidia: Inteligența artificială creează un număr uriaș de locuri de muncă, nu le distruge

Jensen Huang, CEO Nvidia, susține că inteligența artificială va crea un număr uriaș de locuri de muncă, contrazicând temerile legate de șomajul în masă. El argumentează că AI este cea mai bună șansă de reindustrializare a SUA și că automatizarea sarcinilor nu înseamnă neapărat înlocuirea posturilor.

🕒 1 luni în urmă

AI

Ce dezvăluie discuțiile dintre LG și NVIDIA despre viitorul inteligenței artificiale fizice

Discuțiile exploratorii dintre LG și NVIDIA dezvăluie dependențele critice pentru implementarea AI-ului fizic: de la răcirea centrelor de date și roboți casnici cu inferență zero-latență, până la integrarea auto. Parteneriatul ar putea standardiza infrastructura pentru autonomia din lumea reală.

🕒 2 luni în urmă

Filtrează articolele

Subiect: #NVIDIA

Afacerea Nvidia H200 cu China a supraviețuit summitului Trump-Xi – dar nu așa cum se aștepta nimeni

NVIDIA revoluționează antrenarea modelelor AI: metodologie de pre-antrenare pe 4 biți cu NVFP4, validată pe un model hibrid Mamba-Transformer de 12 miliarde de parametri

NVIDIA lansează SANA-WM: modelul mondial open-source cu 2,6 miliarde de parametri care generează videoclipuri de 720p la scară de minute pe un singur GPU

Cerebras strânge 5,5 miliarde de dolari și deschide sezonul IPO-urilor din 2026 cu un bang

Sakana AI și NVIDIA lansează TwELL cu nuclee CUDA: accelerare cu 20,5% la inferență și 21,9% la antrenament pentru modelele de limbaj mari

NVIDIA lansează cuda-oxide: un compilator experimental Rust-to-CUDA care compilează kernel-uri SIMT direct în PTX

NVIDIA lansează Star Elastic: un singur checkpoint care conține trei modele de raționament de 30B, 23B și 12B parametri, cu tăiere zero-shot

Nvidia a investit deja 40 de miliarde de dolari în acțiuni AI în acest an

OpenAI lansează MRC (Multipath Reliable Connection): Un nou protocol de rețea deschis pentru clusterele de antrenare AI la scară largă

SAP pariază 1,16 miliarde de dolari pe un laborator german de AI vechi de 18 luni și spune „da” lui NemoClaw

Jensen Huang, CEO Nvidia: Inteligența artificială creează un număr uriaș de locuri de muncă, nu le distruge

Ce dezvăluie discuțiile dintre LG și NVIDIA despre viitorul inteligenței artificiale fizice