Deepseek yang mengejutkan (namun dibiayai secara besar -besaran) pesaing AI
Deepseek, permulaan AI Cina, telah membuat gelombang dengan chatbot yang baru, yang membanggakan keupayaan yang mengagumkan pada kos yang dikatakan rendah. Pengenalan chatbot: "Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda," mencerminkan cita -citanya. Impaknya sudah jelas, menyumbang kepada penurunan harga saham Nvidia yang signifikan.
Imej: ensigame.com
Kejayaan DeepSeek V3 berpunca daripada kaedah seni bina dan latihan yang inovatif, menggabungkan:
- Ramalan Multi-Token (MTP): Meramalkan beberapa perkataan secara serentak, meningkatkan ketepatan dan kecekapan.
- Campuran Pakar (MOE): Menggunakan 256 rangkaian saraf, mengaktifkan lapan untuk setiap token, mempercepatkan latihan dan meningkatkan prestasi.
- Perhatian Laten Multi-Head (MLA): Berulang kali memberi tumpuan kepada bahagian-bahagian kalimat utama, meminimumkan kehilangan maklumat dan meningkatkan pemahaman yang bernuansa.
DeepSeek pada mulanya mendakwa kos latihan hanya $ 6 juta menggunakan 2048 GPU. Walau bagaimanapun, semianalisis mendedahkan infrastruktur yang jauh lebih besar: kira -kira 50,000 NVIDIA Hopper GPU (termasuk unit H800, H100, dan H20) tersebar di pelbagai pusat data, berjumlah sekitar $ 1.6 bilion dalam pelaburan pelayan dan $ 944 juta dalam perbelanjaan operasi.
Imej: ensigame.com
Subsidiari dana lindung nilai yang tinggi, DeepSeek memiliki pusat datanya, tidak seperti pesaing awan yang bergantung kepada, memupuk inovasi dan pengoptimuman yang lebih cepat. Sifat yang dibiayai sendiri menyumbang kepada ketangkasan dan membuat keputusan yang cepat. Syarikat itu menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun, terutamanya dari universiti -universiti China.
Imej: ensigame.com
Angka $ 6 juta, yang mewakili hanya kos pra-latihan GPU, dengan ketara mengecilkan pelaburan keseluruhan, melebihi $ 500 juta sejak penubuhannya. Struktur Lean Deepseek, bagaimanapun, membolehkan inovasi yang cekap berbanding dengan pesaing birokrasi yang lebih besar.
Imej: ensigame.com
Kejayaan DeepSeek menyoroti potensi syarikat AI bebas yang dibiayai dengan baik. Walaupun tuntutan "belanjawan revolusioner" boleh dikatakan melambung, keberkesanan kosnya berbanding pesaing (contohnya, $ 5 juta untuk R1 vs $ 100 juta untuk chatgpt4o) tidak dapat dinafikan. Pencapaiannya dikaitkan dengan pelaburan yang besar, kemajuan teknologi, dan pasukan yang sangat mahir.