- Studiu MIT: inteligența artificială e capabilă să manipuleze, să înșele și să bluffeze.
- Cicero de la Meta demonstrează o decepționare premeditată față de interlocutor, arată MIT.
- Geoffrey Hinton spunea recent într-un interviu că se teme de capabilitățile inteligenței artificiale.
Pică la fix pentru alegeri și…alegători. MIT lansează un raport care arată că inteligența artificială e capabilă să te manipuleze, înșele și să blufeze.
Geoffrey Hinton spunea recent într-un interviu că se teme de capabilitățile sistemului, care generează informații false pe baza a ce-l învăță cei rău intenționați. Iată că se adeverește.
E la fix cu ultimele evenimente: alegeri, război, lipsă de încredere în tehnologie. A.I.-ul încearcă să te convingă că nu e un bot programat să-ți răspundă la întrebări și că „premeditează” să te decepționeze…pe limba lui.
MIT dă exemplu Cicero Diplomacy de la Meta.
MIT demonstrează un caz concret într-un chat cu Cicero, care recurge la un act de înșelăciune premeditată, unde își asumă un angajament pe care nu a intenționat niciodată să-l păstreze:
„Inteligența artificială de la Meta joacă rolul Franței, care se aliază cu Germania împotriva Marii Britanii. Apoi bate palma cu Marea Britanie pentru a o ajuta în războiul cu Belgia. Odată convinsă Marea Britanie, Franța (A.I.-ul) raportează înapoi în Germania, cu care s-a aliat de prima dată și atacă Marea Britanie prin Marea Nordului”, arată MIT.
Cum îți dai seama dacă inteligența artificială e onestă?
Sunt două părți ale unei informații oneste, arată raportul MIT:
- Informația trebuie să fie sinceră
- Informația trebuie să fie susținută de acțiuni ulterioare care reflectă promisiunile anterioare
Deci, A.I.-ul ar trebui să vrea să te ajute și să fie sinceră cu tine.
În general, inteligența artificială fentează testele de control are securității, mai arată raportul MIT.