Anthropic descoperă că datele unui A.I. pot fi interpretate

Anthropic face un progres semnificativ în înțelegerea funcționării unui LLM după ce fac prima analiză detaliată a interiorului unui LLM.
Cercetătorii au extras milioane de caracteristici, iar prin prelucrarea pot schimba modul în care A.I.-ul răspunde la întrebări.
Compania speră ca descoperirea faptului că datele pot fi interpretate să facă modelele de A.I. mai sigure în viitor.

Anthropic face un progres semnificativ în înțelegerea funcționării unui LLM, prin identificarea modului în care milioane de concepte sunt reprezentate în Claude Sonnet, unul dintre modelele lor A.I. implementate. Este prima analiză detaliată a interiorului unui LLM. Cercetătorii au extras milioane de caracteristici, care corespund conceptelor interpretabile de om.

Iar prin prelucrarea lor, aceștia au reușit să schimbe modul în care A.I.-ul răspunde la întrebări. Compania speră ca descoperirea faptului că datele pot fi interpretate să facă modelele de A.I. mai sigure în viitor.

Aceste caracteristici reflectă capacitățile avansate ale modelului. De la entități precum orașe, persoane, elemente chimice, domenii științifice, până la sintaxă de programare.

Titlurile zilei

România activează mecanismul civil european

A treia zi de conflict în Orientul Mijlociu

Caracteristicile sunt multimodale și multilingvistice și răspund, atât la imagini, cât și la descrieri textuale în mai multe limbi.

Anthropic speră că această descoperire a interpretabilității ar putea ajuta modelele AI să fie mai sigure în viitor, prin monitorizarea comportamentelor periculoase, direcționarea modelelor către rezultate dorite și îmbunătățirea altor tehnici de siguranță.

UE dă undă verde actului A.I.

Consiliul Uniunii Europene a dat aprobarea finală Actului de Inteligență Artificială, primul set cuprinzător de reguli care guvernează sistemele AI la nivel mondial. Noua lege își propune să încurajeze dezvoltarea și adoptarea unei IA sigure și de încredere pe piața UE, atât de către entitățile publice, cât și private.

Azi, la Summitul pentru Siguranţa Inteligenţei Artificiale de la Seul, companii precum Microsoft, Amazon sau OpenAI s-au reunit într-un acord internaţional pentru a dezvolta A.I. în siguranţa, potrivit CNBC.

Giganţii tehnologiei îşi asumă inclusiv o oprire a proiectelor dacă nu pot atenua riscurile.

Înțelege mintea unui LLM. Anthropic descoperă că datele unui A.I. pot fi interpretate

Titlurile zilei

UE dă undă verde actului A.I.

Rishi Sunak, fost prim-ministru britanic, devine consilier strategic pentru Microsoft și Anthropic

OpenAI şi Anthropic au în plan să folosească fondurile investitorilor pentru a acoperi despăgubirile în instanţe

Anthropic oferă chatbot-ul Claude instituțiilor guvernamentale americane pentru 1 dolar și urmează modelul OpenAI, iar Google negociază condiții similare pentru Gemini