Filtrează articolele

Subiect: #învățare prin consolidare

AI Patronus AI atrage 50 de milioane de dolari pentru a construi „lumi digitale” care testează agenții AI

Patronus AI atrage 50 de milioane de dolari pentru a construi „lumi digitale” care testează agenții AI

Patronus AI, un startup fondat de foști cercetători Meta, a strâns 50 de milioane de dolari pentru a construi lumi digitale simulate în care agenții AI sunt testați la limită. Scopul: să se asigure că acești agenți pot executa sarcini complexe fără a face greșeli periculoase. Veniturile au crescut de 15 ori, iar clienții includ toate marile laboratoare AI.

🕒 6 zile în urmă

NVIDIA lansează Polar: un cadru de rollout fidel token-urilor pentru antrenamentul GRPO pe Codex, Claude Code și Qwen Code

NVIDIA a lansat Polar, un cadru de rollout care antrenează agenți lingvistici prin învățare prin consolidare fără a modifica harness-urile. Folosind GRPO pe un model Qwen3.5-4B, Polar îmbunătățește scorul SWE-Bench Verified cu până la 22,6 puncte, fiind integrat în NeMo Gym și ProRL Agent Server.

🕒 1 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.