首頁 新聞 DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

by Sophia Mar 03,2025

DeepSeek令人驚訝的負擔得起(但大量資助)AI競爭對手

DeepSeek是一家中國人工智能初創公司,以其新的聊天機器人的身份引起了轟動,據稱具有令人印象深刻的功能。聊天機器人的介紹:“嗨,我是被創建的,所以您可以問任何東西,並得到一個甚至可能使您感到驚訝的答案,”它的野心反映了。它的影響已經很明顯,導致NVIDIA的股價大幅下降。

DeepSeek測試圖片:ensigame.com

DeepSeek V3的成功源於其創新的建築和培訓方法,並結合了:

  • 多語預測(MTP):同時預測多個詞,提高準確性和效率。
  • 專家的混合物(MOE):使用256個神經網絡,每個令牌激活8個,加速訓練並提高性能。
  • 多頭潛在註意力(MLA):反复專注於關鍵句子部分,最大程度地減少信息丟失並增強細微的理解。

DeepSeek最初聲稱使用2048 GPU的培訓費用僅為600萬美元。但是,半分析顯示基礎設施要大得多:大約50,000個NVIDIA HOPPER GPU(包括H800,H100和H20單位)分佈在多個數據中心,總計約16億美元的服務器投資和9.44億美元的運營費用。

DeepSeek V3圖片:ensigame.com

DeepSeek是高飛行對沖基金的子公司,與雲依賴的競爭對手不同,擁有其數據中心,從而促進了更快的創新和優化。它的自資助性質有助於敏捷性和快速決策。該公司吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要來自中國大學。

DeepSeek圖片:ensigame.com

這筆600萬美元的數字僅代表GPU預培訓的成本,大大低估了整體投資,自成立以來,總投資超過了5億美元。但是,與更大的官僚競爭者相比,DeepSeek的精益結構可以有效地創新。

DeepSeek圖片:ensigame.com

DeepSeek的成功凸顯了資金充足的獨立AI公司的潛力。儘管“革命預算”的主張可以說是誇大的,但其相對於競爭對手的成本效益(例如,R1的500萬美元,Chatgpt4o的1億美元)是不可否認的。它的成就歸因於大量投資,技術進步和高技能的團隊。

最新文章 更多+