Deepseek'in şaşırtıcı derecede uygun fiyatlı (henüz büyük ölçüde finanse edilmiş) AI rakibi
Çinli bir AI girişimi olan Deepseek, yeni chatbot ile dalgalar yaptı ve etkileyici yeteneklere sahip. Chatbot'un tanıtımı: "Merhaba, ben yaratıldım, böylece herhangi bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz," hırsını yansıtır. Etkisi zaten belirgindir ve Nvidia'nın hisse senedi fiyatında önemli bir düşüşe katkıda bulunur.
Resim: ensigame.com
Deepseek V3'ün başarısı, yenilikçi mimari ve eğitim yöntemlerinden kaynaklanmaktadır:
- Çoklu Tahmini Tahmin (MTP): Doğruluğu ve verimliliği artırarak aynı anda birden fazla kelimeyi tahmin eder.
- Uzmanların (MOE) karışımı: 256 sinir ağı kullanır, her jeton için sekiz etkinleştirilir, eğitimi hızlandırır ve performansı artırır.
- Çok Baş Gizli Dikkat (MLA): Tekrar tekrar kilit cümle parçalarına odaklanır, bilgi kaybını en aza indirir ve nüanslı anlayışı artırır.
Deepseek başlangıçta 2048 GPU kullanarak sadece 6 milyon dolarlık bir eğitim maliyeti talep etti. Bununla birlikte, SEMianaliz çok daha büyük bir altyapı ortaya çıkardı: yaklaşık 50.000 NVIDIA Hopper GPU'ları (H800, H100 ve H20 birimleri dahil) birden fazla veri merkezine yayıldı, toplam 1,6 milyar dolarlık sunucu yatırımı ve 944 milyon dolarlık operasyonel giderler.
Resim: ensigame.com
High Flyer Hedge Fonu'nun bir yan kuruluşu olan Deepseek, daha hızlı inovasyon ve optimizasyonu teşvik eden buluta bağımlı rakiplerin aksine veri merkezlerine sahiptir. Kendini finanse eden doğası çevikliğe ve hızlı karar vermeye katkıda bulunur. Şirket, en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde, öncelikle Çin üniversitelerinden.
Resim: ensigame.com
Sadece eğitim öncesi GPU maliyetlerini temsil eden 6 milyon dolarlık rakam, genel yatırımı önemli ölçüde azaltıyor ve kuruluşundan bu yana 500 milyon doları aşıyor. Bununla birlikte, Deepseek'in yalın yapısı, daha büyük, daha bürokratik rakiplere kıyasla verimli bir yeniliğe izin verir.
Resim: ensigame.com
Deepseek'in başarısı, iyi finanse edilen bağımsız AI şirketlerinin potansiyelini vurgular. "Devrimci bütçe" iddiası tartışmalı olarak şişirilirken, rakiplere göre maliyet etkinliği (örneğin, R1 için 5 milyon dolar, chatgpt4o için 100 milyon dolar) inkar edilemez. Başarısı önemli yatırımlara, teknolojik gelişmelere ve yüksek vasıflı bir ekibe atfedilmektedir.