Patronus AI, un startup fondat de foști cercetători Meta, a strâns 50 de milioane de dolari pentru a construi lumi digitale simulate în care agenții AI sunt testați la limită. Scopul: să se asigure că acești agenți pot executa sarcini complexe fără a face greșeli periculoase. Veniturile au crescut de 15 ori, iar clienții includ toate marile laboratoare AI.
Microsoft a lansat ASSERT, un cadru open-source care transformă descrierile textuale ale comportamentului dorit al unui AI în teste automate și scoruri detaliate. Instrumentul ajută dezvoltatorii să verifice rapid dacă sistemele lor respectă politicile specifice aplicațiilor, fără a scrie cod complex de testare.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.