- Tulu3-405B, modelul lansat de AI2, depășește DeepSeek V3 și GPT-4o pe anumite benchmark-uri și este complet open-source, potrivit TechCrunch.
- Modelul este antrenat pe 256 de GPU-uri și demonstrează performanțe excepționale în probleme matematice și interpretarea instrucțiunilor.
- AI2 își propune să poziționeze SUA ca lider în AI open-source, iar Tulu3-405B este accesibil publicului prin chatbot-ul web și platforme precum GitHub și Hugging Face.
Institutul de cercetare AI2 din Seattle lansează Tulu3-405B, un model AI open-source care depășește DeepSeek V3 și chiar GPT-4o de la OpenAI în anumite teste, scrie TechCrunch.
Advertisment
Spre deosebire de modelele concurente, Tulu3-405B este complet accesibil și licențiat permisiv, ceea ce permite oricui să-l reproducă.
Care este importanța pentru AI open-source și SUA?
Reprezentanții AI2 consideră că lansarea acestui model demonstrează capacitatea SUA de a conduce inovația AI generativă open-source.
Titlurile zilei
Aceasta consolidează poziția țării în competiția globală și oferă o alternativă puternică la modelele dezvoltate de DeepSeek și alți giganți tehnologici.
Care sunt capacitățile tehnice?
Tulu3-405B are 405 miliarde de parametri și este antrenat prin folosirea a 256 de GPU-uri în paralel.
O inovație cheie este utilizarea învățării prin întărire cu recompense verificabile (RLVR), care optimizează modelul pentru sarcini cu rezultate verificabile, cum ar fi problemele matematice și interpretarea instrucțiunilor.
Care sunt performanțele în benchmark-uri?
Conform testelor AI2, Tulu3-405B obține cele mai bune rezultate pe PopQA, un set de 14.000 de întrebări de cunoștințe specializate, ce depășește DeepSeek V3, GPT-4o și Llama 3.1 405B de la Meta.
De asemenea, este cel mai performant model pe GSM8K, un test de probleme matematice.
Unde este disponibil?
Modelul poate fi testat prin chatbot-ul web AI2, iar codul său de antrenare este disponibil pe GitHub și Hugging Face. Cei interesați îl pot accesa acum, înainte ca următoarea generație de modele AI să ridice din nou standardele industriei.