HOME Tech

Inteligența artificială manipulează, înșală și blufează, arată MIT

Florescu Dariana

2 ani ago

Studiu MIT: inteligența artificială e capabilă să manipuleze, să înșele și să bluffeze.
Cicero de la Meta demonstrează o decepționare premeditată față de interlocutor, arată MIT.
Geoffrey Hinton spunea recent într-un interviu că se teme de capabilitățile inteligenței artificiale.

Pică la fix pentru alegeri și…alegători. MIT lansează un raport care arată că inteligența artificială e capabilă să te manipuleze, înșele și să blufeze.

Geoffrey Hinton spunea recent într-un interviu că se teme de capabilitățile sistemului, care generează informații false pe baza a ce-l învăță cei rău intenționați. Iată că se adeverește.

E la fix cu ultimele evenimente: alegeri, război, lipsă de încredere în tehnologie. A.I.-ul încearcă să te convingă că nu e un bot programat să-ți răspundă la întrebări și că „premeditează” să te decepționeze…pe limba lui.

MIT dă exemplu Cicero Diplomacy de la Meta.

MIT demonstrează un caz concret într-un chat cu Cicero, care recurge la un act de înșelăciune premeditată, unde își asumă un angajament pe care nu a intenționat niciodată să-l păstreze:

„Inteligența artificială de la Meta joacă rolul Franței, care se aliază cu Germania împotriva Marii Britanii. Apoi bate palma cu Marea Britanie pentru a o ajuta în războiul cu Belgia. Odată convinsă Marea Britanie, Franța (A.I.-ul) raportează înapoi în Germania, cu care s-a aliat de prima dată și atacă Marea Britanie prin Marea Nordului”, arată MIT.

Cum îți dai seama dacă inteligența artificială e onestă?

Sunt două părți ale unei informații oneste, arată raportul MIT:

Informația trebuie să fie sinceră
Informația trebuie să fie susținută de acțiuni ulterioare care reflectă promisiunile anterioare

Deci, A.I.-ul ar trebui să vrea să te ajute și să fie sinceră cu tine.

În general, inteligența artificială fentează testele de control are securității, mai arată raportul MIT.