Deepseeks überraschend erschwinglich (aber doch massiv finanziert) AI -Konkurrent
Deepseek, ein chinesisches KI -Startup, hat mit seinem neuen Chatbot Wellen geschlagen und mit beeindruckenden Fähigkeiten zu einem angeblich geringen Kosten verfügt. Die Einführung des Chatbots: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte", spiegelt das Ehrgeiz wider. Die Auswirkungen sind bereits offensichtlich und tragen zu einem erheblichen Rückgang des NVIDIA -Aktienkurs bei.
Bild: Ensigame.com
Der Erfolg von Deepseek V3 ergibt sich aus seinen innovativen Architektur- und Trainingsmethoden, in denen es umgeht:
- Multi-Token-Vorhersage (MTP): Prognose mehrere Wörter gleichzeitig, steigern Sie die Genauigkeit und Effizienz.
- Mischung von Experten (MOE): Verwendet 256 neuronale Netze, die acht für jedes Token aktivieren, das Training beschleunigen und die Leistung verbessern.
- Multi-Head Latent Achtung (MLA): Konzentriert sich wiederholt auf wichtige Satzteile, minimiert den Verlust des Informationen und verbessert das nuancierte Verständnis.
Deepseek beanspruchte zunächst die Schulungskosten von nur 6 Millionen US -Dollar mit 2048 GPUs. Die semiianalyse ergab jedoch eine weitaus größere Infrastruktur: ungefähr 50.000 NVIDIA Hopper -GPUs (einschließlich H800, H100 und H20 -Einheiten), die sich in mehreren Rechenzentren in Höhe von mehreren Rechenzentren in Höhe von rund 1,6 Milliarden US -Dollar in den Serverinvestitionen und den Betriebskosten in Höhe von 944 Mio. USD auswirken.
Bild: Ensigame.com
Deepseek, eine Tochtergesellschaft des High-Flyer-Hedgefonds, besitzt seine Rechenzentren im Gegensatz zu Cloud-abhängigen Wettbewerbern, die eine schnellere Innovation und Optimierung fördert. Seine selbstfinanzierte Natur trägt zur Beweglichkeit und zur schnellen Entscheidungsfindung bei. Das Unternehmen zieht Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von chinesischen Universitäten.
Bild: Ensigame.com
Der Wert von 6 Mio. USD, der nur die GPU-Kosten vor der Training entspricht, unterschätzt die Gesamtinvestition erheblich und über 500 Millionen US-Dollar seit ihrer Gründung. Deepseeks Lean -Struktur ermöglicht jedoch effiziente Innovationen im Vergleich zu größeren, bürokratischeren Wettbewerbern.
Bild: Ensigame.com
Der Erfolg von Deepseek unterstreicht das Potenzial gut finanzierter unabhängiger KI-Unternehmen. Während die Behauptung des "revolutionären Budgets" wohl aufgeblasen wird, ist seine Kosteneffizienz im Vergleich zu Wettbewerbern (z. B. 5 Millionen US-Dollar für R1 gegenüber 100 Millionen US-Dollar für CHATGPT4O) unbestreitbar. Die Leistung wird auf erhebliche Investitionen, technologische Fortschritte und ein hochqualifiziertes Team zurückgeführt.