HOME A.I.

E power A.I.? OpenAI arată sistemul de evaluare a puterii modelelor sale

Bâlu Bianca

2 ani ago

OpenAI face public un sistem intern de evaluare a capacităților modelelor sale de inteligență artificială.
Conform noului cadru de evaluare, modelele actuale precum ChatGPT, se situează la Nivelul 1.
Nivelurile 3 și 4 ale sistemului de evaluare descriu sisteme A.I. cu capacități din ce în ce mai avansate.

OpenAI, compania din spatele popularului ChatGPT, face public un sistem intern de evaluare a capacităților modelelor sale de inteligență artificială. Acest sistem, structurat pe cinci niveluri, are ca scop măsurarea progresului către inteligența artificială generală, un obiectiv ambițios al companiei.

Conform noului cadru de evaluare, modelele actuale de A.I. conversațională, precum ChatGPT, se situează la Nivelul 1. OpenAI consideră însă că se află aproape de atingerea Nivelului 2, denumit „Reasoners”. Acest nivel implică sisteme capabile să rezolve probleme fundamentale la nivelul unui deținător de doctorat, fără a necesita resurse externe.

Care sunt celelalte niveluri ale OpenAI?

Nivelurile 3 și 4 ale sistemului de evaluare descriu sisteme A.I. cu capacități din ce în ce mai avansate. Nivelul 3, denumit „Agents”, se referă la sisteme care pot executa sarcini autonome în numele utilizatorilor. Nivelul 4 implică modele capabile să genereze inovații originale, depășind creativitatea umană în anumite domenii.

Nivelul 5, considerat crucial pentru atingerea AGI, descrie sisteme A.I. care pot executa sarcini echivalente cu organizații întregi de oameni.

Provocări etice și de siguranță

Deși acest sistem de evaluare reprezintă un pas important în cuantificarea progresului inteligenței artificiale, el ridică și întrebări serioase despre implicațiile etice și de siguranță ale dezvoltării unor sisteme atât de avansate. Recent, OpenAI a fost criticată pentru desființarea echipei sale de siguranță Superalignment, dedicată gestionării riscurilor pe termen lung ale A.I.-ului.

Foști angajați, precum Jan Leike, au exprimat îngrijorări cu privire la prioritizarea produselor în detrimentul siguranței și impactului societal. Aceste preocupări subliniază necesitatea unui echilibru între inovație și responsabilitate în dezvoltare.

Sistemul de evaluare al OpenAI ar putea deveni un standard în industrie, oferind un cadru pentru măsurarea și compararea capacităților diferitelor modele. Acest lucru ar putea accelera competiția în domeniu, stimulând inovația, dar și intensificând dezbaterile despre reglementarea și controlul tehnologiilor A.I avansate.

Pentru societate în ansamblu, progresul rapid către niveluri superioare de A.I. ridică întrebări despre impactul asupra pieței muncii, educației și structurilor sociale existente.