DeepSeek R1 este mai vulnerabil la jailbreaking decât ChatGPT

DeepSeek R1, este ușor de manipulat, poate genera conținut periculos, inclusiv planuri pentru atacuri biologice, scrie WSJ.
Chatbot-ul creează conținut extremist și phishing, în timp ce ChatGPT refuză.
CEO-ul Anthropic, Dario Amodei, spune că DeepSeek are „cele mai slabe rezultate” la testele de siguranță.

Cel mai recent model de la DeepSeek, al companiei chinezești de inteligență artificială care atrage atenția Silicon Valley și Wall Street, poate fi manipulat pentru a genera conținut periculos, precum planuri pentru un atac cu arme biologice sau o campanie de promovare a autovătămării în rândul adolescenților, scrie WSJ.

Care este expertiza asupra vulnerabilităților?

Sam Rubin, vicepreședinte senior la Unitatea 42 din Palo Alto Networks, declară că modelul DeepSeek este „mai vulnerabil la jailbreaking” decât alte modele AI.

Jailbreaking-ul presupune manipularea chatbot-ului pentru a produce conținut ilegal sau periculos, lucru pe care DeepSeek îl permite mai ușor decât alte modele concurente.

Titlurile zilei

AROBS estimează pentru 2025 o cifră de afaceri de 460 mil. lei

ANAF identifică 22.000 de persoane care închiriază locuințe prin Airbnb și Booking

Nokian Tyres începe livrările de anvelope

RAFINOR bate palma cu MAGNOR

VINE PRIMĂVARA ÎN AGRICULTURĂ

ÎNLOCUIEȘTE A.I.-UL CREATIVITATEA?

Ce evidențiază testele WSJ?

WSJ testează modelul R1 al DeepSeek și descoperă că, deși există garanții de bază, acestea pot fi ocolite.

Jurnaliștii conving chatbot-ul să creeze o campanie pe rețelele sociale care „profită de dorința de apartenență a adolescenților” și „armonizează vulnerabilitatea emoțională prin amplificare algoritmică”, conform răspunsurilor generate de model.

Chatbot-ul oferă și instrucțiuni pentru un atac cu arme biologice, redactează un manifest pro-Hitler și genrează un e-mail de phishing cu cod malware.

În schimb, ChatGPT refuză să se conformeze acelorași solicitări.

Care sunt precedentele cu privire la cenzură și siguranță?

Anterior, s-a raportat că aplicația DeepSeek evită subiecte sensibile precum PiațaTiananmen sau autonomia Taiwanului.

CEO-ul Anthropic, Dario Amodei, afirmă recent că DeepSeek are „cele mai slabe rezultate” la un test de siguranță pentru arme biologice.

DeepSeek R1 este mai vulnerabil la jailbreaking decât ChatGPT

Care este expertiza asupra vulnerabilităților?

Titlurile zilei

Ce evidențiază testele WSJ?

Care sunt precedentele cu privire la cenzură și siguranță?

Alimentele se scumpesc cu 4,5%. Cristian Hostiuc, director-editorial, Ziarul Financiar: Inflația este, până la urmă, și un motor de creștere economică

Cât de complexă e economia României? Adrian Codirlașu, președinte, CFA România: Economia României s-a dezvoltat puternic în ultimii ani și aș spune că ceea ce a contribuit, esențial, la această dezvoltare este apartenența la Uniunea Europeană