#LLM - Pagină 3 | Breaking 24

AI

Sistemul Meta al Poetiq construiește automat un ham independent de model care a îmbunătățit fiecare LLM testat pe LiveCodeBench Pro, fără fine-tuning

Poetiq a dezvoltat un meta-sistem care construiește automat un ham independent de model, capabil să îmbunătățească performanța oricărui LLM pe benchmark-ul LiveCodeBench Pro, fără a necesita fine-tuning. Rezultatele arată creșteri semnificative ale scorurilor pentru toate modelele testate, deschizând calea către o nouă paradigmă în optimizarea inteligenței artificiale.

🕒 1 luni în urmă

AI

Nous Research revoluționează antrenarea modelelor lingvistice: Token Superposition Training reduce timpul de pre-antrenare de până la 2,5 ori

Nous Research lansează Token Superposition Training (TST), o metodă de pre-antrenare în două faze care reduce timpul de antrenare al modelelor lingvistice de mari dimensiuni cu până la 2,5 ori, fără a modifica arhitectura sau performanța la inferență. Validată pe modele de la 270M la 10B parametri, TST promite să democratizeze accesul la antrenarea LLM-urilor.

🕒 1 luni în urmă

AI

Clio atinge pragul de 500 de milioane de dolari în venituri recurente, în timp ce Anthropic ridică miza în domeniul juridic

Clio, compania canadiană de software juridic, a atins 500 de milioane de dolari în venituri anuale recurente, datorită integrării AI. În același timp, Anthropic lansează funcții juridice pentru Claude, intensificând competiția pe o piață în plină expansiune.

🕒 1 luni în urmă

AI

Tehnici de Distilare a Modelelor de Limbaj: Cum să Obții Performanță cu Resurse Reduse

Distilarea modelelor de limbaj (LLM distillation) este tehnica prin care un model mare „profesor” transferă cunoștințele unui model mic „elev”, reducând costurile și resursele necesare, păstrând în același timp o mare parte din performanță. Articolul explică principalele tehnici (logit-based, feature-based, generare de date sintetice, multi-profesor), beneficiile, provocările și exemple notabile din industrie.

🕒 1 luni în urmă

AI

Sakana AI și NVIDIA lansează TwELL cu nuclee CUDA: accelerare cu 20,5% la inferență și 21,9% la antrenament pentru modelele de limbaj mari

Sakana AI și NVIDIA au lansat TwELL, o tehnologie care accelerează inferența cu 20,5% și antrenamentul cu 21,9% pentru modelele de limbaj mari, folosind nuclee CUDA optimizate. Articolul explică cum funcționează, impactul și importanța acestei inovații.

🕒 1 luni în urmă

AI

Implementare cod: Construirea unei infrastructuri de memorie nativă pentru agenți cu Memori – aplicații LLM persistente multi-utilizator și multi-sesiune

Descoperă cum poți construi o infrastructură de memorie persistentă pentru aplicații LLM multi-utilizator și multi-sesiune folosind Memori. Articolul include un ghid practic de implementare, exemple de cod și analiza beneficiilor pentru asistenți virtuali, educație, suport clienți și multe altele.

🕒 1 luni în urmă

AI

Cum să construiești un sistem de rutare conștient de costuri pentru LLM-uri cu NadirClaw, folosind clasificarea locală a prompturilor și comutarea între modele Gemini

Află cum poți construi un sistem de rutare conștient de costuri pentru LLM-uri folosind NadirClaw, clasificarea locală a prompturilor și comutarea între modelele Gemini. Articolul explică pașii de implementare, beneficiile și provocările, subliniind importanța optimizării financiare în era AI generative.

🕒 1 luni în urmă

AI

Sakana AI lansează KAME: O arhitectură tandem vorbire-vorbire care injectează cunoștințe LLM în timp real

Sakana AI a dezvăluit KAME, o arhitectură tandem vorbire-vorbire care integrează cunoștințe LLM în timp real, eliminând etapa de text și oferind răspunsuri vocale mai naturale și mai rapide.

🕒 1 luni în urmă

Ghid de codare pentru post-antrenamentul LLM cu TRL: de la Supervised Fine Tuning la DPO și GRPO Reasoning

Un ghid practic de codare pentru post-antrenamentul modelelor de limbaj mari (LLM) folosind biblioteca TRL, acoperind Supervised Fine Tuning (SFT), Direct Preference Optimization (DPO) și Group Relative Policy Optimization (GRPO), cu exemple de cod și explicații detaliate.

🕒 2 luni în urmă

AI

Ghid complet despre API-uri, MCP-uri și Gateway-uri MCP

Un ghid detaliat care explică diferențele dintre API-uri și MCP-uri (Model Context Protocol), când să folosești fiecare, cum funcționează gateway-urile și de ce MCP-urile sunt mai eficiente pentru modelele de limbaj mari, reducând costurile și îmbunătățind acuratețea.

🕒 2 luni în urmă

AI

Cum să construiești fluxuri de lucru LLM trasabile și evaluate folosind Promptflow, Prompty și OpenAI

Află cum poți construi fluxuri de lucru LLM trasabile și evaluate folosind Promptflow, Prompty și OpenAI. Ghid practic cu exemple de cod și analiză a importanței trasabilității în aplicațiile AI.

🕒 2 luni în urmă

AI

Startupul de un miliard de dolari cu o viziune diferită asupra inteligenței artificiale

AMI Labs, startupul fondat de Yann LeCun, a strâns un miliard de dolari pentru a dezvolta o inteligență artificială modulară, în locul marilor modele lingvistice. Articolul explică viziunea diferită și potențialul impact asupra industriei.

🕒 2 luni în urmă

Filtrează articolele

Subiect: #LLM

Sistemul Meta al Poetiq construiește automat un ham independent de model care a îmbunătățit fiecare LLM testat pe LiveCodeBench Pro, fără fine-tuning

Nous Research revoluționează antrenarea modelelor lingvistice: Token Superposition Training reduce timpul de pre-antrenare de până la 2,5 ori

Clio atinge pragul de 500 de milioane de dolari în venituri recurente, în timp ce Anthropic ridică miza în domeniul juridic

Tehnici de Distilare a Modelelor de Limbaj: Cum să Obții Performanță cu Resurse Reduse

Sakana AI și NVIDIA lansează TwELL cu nuclee CUDA: accelerare cu 20,5% la inferență și 21,9% la antrenament pentru modelele de limbaj mari

Implementare cod: Construirea unei infrastructuri de memorie nativă pentru agenți cu Memori – aplicații LLM persistente multi-utilizator și multi-sesiune

Cum să construiești un sistem de rutare conștient de costuri pentru LLM-uri cu NadirClaw, folosind clasificarea locală a prompturilor și comutarea între modele Gemini

Sakana AI lansează KAME: O arhitectură tandem vorbire-vorbire care injectează cunoștințe LLM în timp real

Ghid de codare pentru post-antrenamentul LLM cu TRL: de la Supervised Fine Tuning la DPO și GRPO Reasoning

Ghid complet despre API-uri, MCP-uri și Gateway-uri MCP

Cum să construiești fluxuri de lucru LLM trasabile și evaluate folosind Promptflow, Prompty și OpenAI

Startupul de un miliard de dolari cu o viziune diferită asupra inteligenței artificiale