#inteligență artificială - Pagină 56

AI

Prezentarea Falcon-H1-Arabic: Extinderea limitelor inteligenței artificiale pentru limba arabă printr-o arhitectură hibridă inovatoare

Falcon-H1-Arabic reprezintă un salt tehnologic major în procesarea limbajului natural pentru limba arabă, introducând o arhitectură hibridă Mamba-Transformer inovatoare. Cu modele de 3B, 7B și 34B parametri capabile să proceseze până la 256.000 de tokeni, această familie depășește performanțele modelelor existente, inclusiv pe cele mai mari, stabilind noi standarde în benchmark-urile OALL și 3LM.

🕒 3 luni în urmă

Tehnologie

NVIDIA Cosmos Reason 2: O nouă eră în raționamentul artificial pentru roboți și sisteme autonome

NVIDIA lansează Cosmos Reason 2, un model vizual-lingvistic revoluționar care oferă roboților și agenților AI capacitatea de a raționa și planifica în lumea fizică. Cu îmbunătățiri majore în înțelegerea spațio-temporală și suport pentru 256K tokeni, modelul lider pe Physical AI Bench transformă analiza video, adnotarea datelor și planificarea robotică.

🕒 3 luni în urmă

AI

Differential Transformer V2: O nouă eră în eficiența și stabilitatea modelelor de limbaj de mari dimensiuni

Differential Transformer V2 (DIFF V2) revoluționează arhitectura LLM prin optimizarea eficienței inferenței și eliminarea instabilității numerice specifice versiunii anterioare. Prin dublarea capetelor de interogare și o nouă operație diferențială, modelul depășește constrângerile Softmax, oferind o decodare rapidă fără a necesita nuclee personalizate.

🕒 3 luni în urmă

AI

AssetOpsBench: Puntea dintre benchmark-urile AI și realitatea industrială – Un nou standard pentru evaluarea agenților inteligenți

AssetOpsBench reprezintă o evoluție necesară în evaluarea agenților AI, trecând de la simplul succes binar la o analiză complexă a eșecurilor în medii industriale reale. Acest cadru innovator evidențiază lacunele critice ale modelelor actuale în coordonarea multi-agent și gestionarea incertitudinii operaționale.

🕒 3 luni în urmă

AI

Claude construiește kernele CUDA și instruiește modelele open-source: O revoluție în optimizarea AI

Un articol detaliat despre utilizarea modelului Claude pentru a genera și transfera abilități de programare CUDA către modele open-source mai mici, democratizând accesul la expertiza avansată în optimizarea GPU.

🕒 3 luni în urmă

AI

Prezentând Daggr: Înlănțuirea programabilă a aplicațiilor cu inspecție vizuală

Daggr revoluționează dezvoltarea aplicațiilor AI prin combinarea abordării code-first cu vizualizarea automată a fluxurilor de lucru, permițând dezvoltatorilor să inspecteze și reexecute pași individuali fără a relua întregul pipeline.

🕒 3 luni în urmă

Tehnologie

Noul model Holo2 de la H Company stabilește noi standarde în localizarea interfețelor grafice (UI)

H Company lansează Holo2-235B-A22B Preview, un model revoluționar de localizare UI care stabilește recorduri SOTA în benchmark-uri precum Screenspot-Pro și OSWorld G, utilizând o abordare agentică pentru a naviga interfețele complexe 4K.

🕒 3 luni în urmă

AI

IBM și UC Berkeley diagnostichează motivele eșecului agenților enterprise folosind IT-Bench și MAST

Un studiu realizat de IBM și UC Berkeley utilizează taxonomia MAST pentru a diseca eșecurile agenților AI în medii enterprise, dezvăluind diferențele critice dintre modelele de frontieră și cele open-source și oferind o metodologie clară pentru diagnosticarea și remedierea erorilor sistematice.

🕒 3 luni în urmă

AI

Antrenarea modelelor AI cu Unsloth și Hugging Face Jobs: Ghid Complet Gratuit

Un ghid complet despre cum să antrenați modele AI gratuit folosind Unsloth și Hugging Face Jobs. Aflați cum să utilizați modele mici precum LFM2.5-1.2B-Instruct, să instalați skill-uri pentru agenți de codare și să rulați job-uri de antrenare pe GPU-uri cloud gestionate automat.

🕒 3 luni în urmă

AI

LeRobot v0.5.0: O nouă eră în robotică și inteligența artificială încorporată

LeRobot v0.5.0 revoluționează robotica open-source prin integrarea robotului umanoid Unitree G1, introducerea modelelor autoregressive Pi0-FAST și optimizarea masivă a fluxului de date, eliminând timpii morți în înregistrare și accelerând antrenarea modelelor vizuale.

🕒 3 luni în urmă

AI

Menținând Fluxul de Token-uri: Lecții din 16 Biblioteci Open-Source de Învățare prin Întărire

O analiză tehnică detaliată a arhitecturilor de învățare prin întărire asincronă, extrăgând principii de design esențiale din 16 biblioteci open-source pentru a optimiza antrenarea modelelor de limbaj de mari dimensiuni.

🕒 3 luni în urmă

AI

Holotron-12B: O nouă eră în agenții AI pentru utilizarea computerelor – performanță, eficiență și scalabilitate

H Company lansează Holotron-12B, un model AI multimodal revoluționar, optimizat pentru agenți care utilizează computerele. Cu o arhitectură hibridă SSM ce dublează debitul de inferență față de predecesorii săi, modelul excelează în sarcini complexe de navigare și interacțiune vizuală, deschizând calea pentru automatizarea autonomă la scară largă.

🕒 3 luni în urmă

Filtrează articolele

Subiect: #inteligență artificială

Prezentarea Falcon-H1-Arabic: Extinderea limitelor inteligenței artificiale pentru limba arabă printr-o arhitectură hibridă inovatoare

NVIDIA Cosmos Reason 2: O nouă eră în raționamentul artificial pentru roboți și sisteme autonome

Differential Transformer V2: O nouă eră în eficiența și stabilitatea modelelor de limbaj de mari dimensiuni

AssetOpsBench: Puntea dintre benchmark-urile AI și realitatea industrială – Un nou standard pentru evaluarea agenților inteligenți

Claude construiește kernele CUDA și instruiește modelele open-source: O revoluție în optimizarea AI

Prezentând Daggr: Înlănțuirea programabilă a aplicațiilor cu inspecție vizuală

Noul model Holo2 de la H Company stabilește noi standarde în localizarea interfețelor grafice (UI)

IBM și UC Berkeley diagnostichează motivele eșecului agenților enterprise folosind IT-Bench și MAST

Antrenarea modelelor AI cu Unsloth și Hugging Face Jobs: Ghid Complet Gratuit

LeRobot v0.5.0: O nouă eră în robotică și inteligența artificială încorporată

Menținând Fluxul de Token-uri: Lecții din 16 Biblioteci Open-Source de Învățare prin Întărire

Holotron-12B: O nouă eră în agenții AI pentru utilizarea computerelor – performanță, eficiență și scalabilitate