• DeepSeek dezvoltă modele open-source avansate, precum DeepSeek-V3 și DeepSeek-R1, bazate pe tehnici inovatoare precum învățarea prin întărire și arhitectura MoE, scrie Bloomberg.
  • Lansarea modelelor DeepSeek declanșează un război al prețurilor în China și forțează giganții AI globali, precum OpenAI și Google, să își reevalueze strategiile.
  • Deși DeepSeek se confruntă cu restricții cu privire la accesul la cipuri avansate și cu probleme de cenzură, modelul său cost-eficient și strategia open-source îl transformă într-un rival puternic, capabil să influențeze peisajul AI global.

DeepSeek, un start-up chinez, captează atenția globală prin lansarea unor modele de inteligență artificială open-source extrem de eficiente, scrie Bloomberg.

Fondată în mai 2023 de Liang Wenfeng și finanțată de fondul său speculativ High-Flyer, compania funcționează fără presiunea investitorilor externi și îi permite să se concentreze pe cercetare și dezvoltare.

Cum evoluează modelele DeepSeek?

DeepSeek își începe activitatea cu DeepSeek Coder în noiembrie 2023, un model dedicat codării.

Titlurile zilei

Averile miliardarilor cresc accelerat
CE URMEAZĂ PE BVB?
Memecoins exploatează tragedia lui Charlie Kirk
Aurul scade cu 0,5% la 3.671 dolari pe uncie
DRUID AI OBȚINE 32 MIL. DOLARI FINANȚARE

Urmează DeepSeek LLM (67 miliarde de parametri), destinat competiției cu modelele de limbaj mari.

În mai 2024, DeepSeek-V2 atrage atenția pentru performanța sa ridicată și costul redus și declanșează un război al prețurilor în China.

Apoi, DeepSeek lansează DeepSeek-Coder-V2 (236 miliarde de parametri, 128.000 de jetoane contextuale), optimizat pentru codare avansată.

Cele mai recente modele includ DeepSeek-V3 (671 miliarde de parametri), care concurează cu modelele de vârf, și DeepSeek-R1, lansat în ianuarie 2025, un model specializat în raționament, ce rivalizează cu OpenAI O1.

DeepSeek oferă și modele distilate sub forma DeepSeek-R1-Distill, optimizate pe date sintetice generate de R1. Cu toate acestea, DeepSeek nu are în plan o comercializare pe scară largă în viitorul apropiat și se concentrează doar pe cercetare.

Cu cine colaborează DeepSeek?

DeepSeek colaborează cu AMD și utilizează GPU-urile AMD Instinct și software-ul ROCM pentru a optimiza dezvoltarea modelelor sale, în special DeepSeek-V3.

Acest parteneriat îi oferă acces la hardware de înaltă performanță și tehnologii open-source și consolidează eficiența și scalabilitatea modelelor sale.

Ce aduce nou DeepSeek?

DeepSeek se remarcă prin mai multe abordări tehnologice:

  • Învățare prin întărire (RL) – Modelele învață prin încercare și eroare și dezvoltă capacități avansate de raționament.
  • Arhitectură MoE (Mixture of Experts) – Activează doar o parte a parametrilor pentru fiecare sarcină și reduce costurile de calcul și optimizând resursele.
  • Atenție latentă cu mai multe capete (MLA) – Îmbunătățește procesarea datelor și facilitează analiza relațiilor complexe dintre variabile.
  • Distilare – Permite modelelor mai mici să moștenească capacitățile modelelor mai mari și reduce necesarul de resurse.

Care este strategia DeepSeek?

DeepSeek îți consolidează poziția printr-o strategie agresivă de reducere a costurilor:

  • Costuri reduse de antrenare – DeepSeek-V3 este dezvoltat cu doar 5,5 milioane de dolari, o fracțiune din costurile modelelor Meta sau OpenAI.
  • Prețuri API competitive – DeepSeek-R1 costă doar 0,55 dolari per milion de jetoane de intrare, comparativ cu 15 dolari pentru OpenAI.
  • Model open-source – Favorizează adoptarea pe scară largă, elimină taxele de licență și reduce barierele financiare pentru dezvoltatori.

Care este impactul asupra industriei AI?

DeepSeek are un impact semnificativ asupra industriei AI și forțează giganții consacrați să-și reducă prețurile și să își îmbunătățească modelele.

Competiția cu OpenAI, Google și Meta conduce la o democratizare a tehnologiei AI și oferă soluții mai accesibile pentru dezvoltatori și companii mai mici.

În China, modelul disruptiv al DeepSeek determină giganți precum ByteDance, Tencent și Alibaba să-și ajusteze strategiile.

Cum evoluează piețele financiare?

Investitorii sunt îngrijorați că modelele AI ale startup-ului chinez sunt mai eficiente și mai accesibile și pun sub semnul întrebării evaluările ridicate ale companiilor precum Nvidia.

Contractele futures pe Nasdaq 100 scad cu 2,6%, iar S&P 500 cu 1,4%, în timp ce acțiunile Nvidia se depreciază cu peste 5%.

Companiile chineze din domeniul AI înregistrează creșteri, iar indicele Hang Seng Tech avansează cu 2%.

Apariția DeepSeek accentuează temerile cu privire la pierderea dominației SUA în AI și pune presiune pe marile companii să-și regândească strategiile de investiții.

Care sunt provocările DeepSeek?

DeepSeek se confruntă cu mai multe provocări:

  • Limitările de calcul – Restricțiile SUA asupra exporturilor de cipuri avansate, precum Nvidia H100, afectează accesul DeepSeek la hardware de ultimă generație.
  • Percepția pieței – Compania trebuie să-și construiască reputația și să câștige încrederea dezvoltatorilor, în fața unor rivali consacrați.
  • Peisajul competitiv – Giganții AI inovează constant și forțează DeepSeek să mențină un ritm rapid de dezvoltare.
  • Cenzura – Modelele DeepSeek sunt supuse reglementărilor chineze, ceea ce ar putea limita adoptarea lor globală.

Care este impactul geopolitic și economic?

Lansarea modelelor DeepSeek are efecte și pe piețele financiare și afectează acțiunile companiilor AI americane.

Wall Street reevaluează acum investițiile uriașe ale giganților tehnologici, iar unii analiști sugerează că DeepSeek ar putea reduce cererea pentru cipurile Nvidia.

La nivel geopolitic, succesul DeepSeek sugerează că restricțiile SUA asupra exportului de cipuri ar putea avea un impact limitat asupra progresului AI în China. Aceasta ridică întrebări despre eficiența măsurilor luate de Washington pentru a menține avansul tehnologic al SUA.

Ce urmează pentru DeepSeek?

Deși DeepSeek nu are încă o strategie clară de comercializare, inovațiile sale continuă să influențeze dezvoltarea AI la nivel global. Cu o strategie bazată pe eficiență, costuri reduse și tehnologie open-source, DeepSeek ar putea deveni un jucător de top în domeniul AI și poate pune presiune pe liderii consacrați.

Pe măsură ce AI devine tot mai integrată în industrii diverse, ascensiunea DeepSeek demonstrează că progresul tehnologic nu mai depinde exclusiv de resurse uriașe de calcul și investiții masive, ci și de inovație și optimizare.