Il concorrente di intelligenza artificiale sorprendentemente conveniente di DeepSeek (ma massicciamente finanziato)
DeepSeek, una startup cinese AI, ha fatto ondate con il suo nuovo chatbot, vantando capacità impressionanti a un costo presumibilmente basso. L'introduzione del chatbot: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti", riflette la sua ambizione. Il suo impatto è già evidente, contribuendo a un calo significativo del prezzo delle azioni di Nvidia.
Immagine: Ensigame.com
Il successo di Deepseek V3 deriva dalla sua architettura innovativa e metodi di formazione, incorporando:
- Multi-Token Prediction (MTP): prevede contemporaneamente più parole, aumentando l'accuratezza ed efficienza.
- Miscela di esperti (MOE): utilizza 256 reti neurali, attivando otto per ogni token, accelerando la formazione e migliorando le prestazioni.
- Attenzione latente multi-testa (MLA): si concentra ripetutamente su parti di frasi chiave, minimizzando la perdita di informazioni e migliorando la comprensione sfumata.
DeepSeek inizialmente ha rivendicato un costo di formazione di soli $ 6 milioni utilizzando 2048 GPU. Tuttavia, la seminalisi ha rivelato un'infrastruttura molto più grande: circa 50.000 GPU di Nvidia Hopper (tra cui unità H800, H100 e H20) si sono diffuse su più data center, per un totale di circa $ 1,6 miliardi di investimenti in server e $ 944 milioni di spese operative.
Immagine: Ensigame.com
Controllata dell'hedge fund ad alto frigo, DeepSeek possiede i suoi data center, a differenza dei concorrenti al centro del cloud, promuovendo innovazione e ottimizzazione più veloci. La sua natura autofinanziata contribuisce all'agilità e al rapido processo decisionale. La società attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle università cinesi.
Immagine: Ensigame.com
La cifra di $ 6 milioni, che rappresenta solo i costi di GPU pre-allenamento, sottovaluta in modo significativo l'investimento complessivo, superiore a $ 500 milioni dalla sua istituzione. La struttura magra di Deepseek, tuttavia, consente un'innovazione efficiente rispetto ai concorrenti più grandi e burocratici.
Immagine: Ensigame.com
Il successo di Deepseek evidenzia il potenziale di società di intelligenza artificiale indipendenti ben finanziate. Mentre l'affermazione del "bilancio rivoluzionario" è probabilmente gonfiata, il suo efficacia in termini di costi relativi ai concorrenti (ad esempio, $ 5 milioni per R1 contro $ 100 milioni per Chatgpt4o) è innegabile. Il suo successo è attribuito a investimenti sostanziali, progressi tecnologici e un team altamente qualificato.