คู่แข่ง AI ของ Deepseek ราคาไม่แพงอย่างน่าประหลาดใจ
Deepseek การเริ่มต้น AI จีนได้สร้างคลื่นด้วย chatbot ใหม่ซึ่งมีความสามารถที่น่าประทับใจในราคาที่ต่ำโดยเจตนา การแนะนำของ Chatbot: "สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ" สะท้อนความทะเยอทะยานของมัน ผลกระทบของมันเห็นได้ชัดแล้วซึ่งมีส่วนทำให้ราคาหุ้นของ Nvidia ลดลงอย่างมีนัยสำคัญ
รูปภาพ: Ensigame.com
ความสำเร็จของ Deepseek V3 เกิดจากสถาปัตยกรรมและวิธีการฝึกอบรมที่เป็นนวัตกรรม
- การทำนายแบบมัลติเทน (MTP): ทำนายหลายคำพร้อมกันเพิ่มความแม่นยำและประสิทธิภาพ
- ส่วนผสมของผู้เชี่ยวชาญ (MOE): ใช้เครือข่ายประสาท 256 เครือข่ายเปิดใช้งานแปดโทเค็นแต่ละโทเค็นเร่งการฝึกอบรมและปรับปรุงประสิทธิภาพ
- ความสนใจแฝงหลายหัว (MLA): มุ่งเน้นไปที่ชิ้นส่วนประโยคที่สำคัญซ้ำ ๆ ลดการสูญเสียข้อมูลและเพิ่มความเข้าใจที่เหมาะสม
ในขั้นต้น Deepseek อ้างว่ามีค่าใช้จ่ายในการฝึกอบรมเพียง 6 ล้านเหรียญสหรัฐโดยใช้ GPU 2048 อย่างไรก็ตาม Semianalysis เปิดเผยโครงสร้างพื้นฐานที่มีขนาดใหญ่กว่า: ประมาณ 50,000 Nvidia Hopper GPU (รวมถึง H800, H100 และ H20 หน่วย) กระจายไปทั่วศูนย์ข้อมูลหลายแห่งรวมอยู่ที่ประมาณ 1.6 พันล้านดอลลาร์ในการลงทุนเซิร์ฟเวอร์และค่าใช้จ่ายในการดำเนินงาน 944 ล้านดอลลาร์
รูปภาพ: Ensigame.com
บริษัท ย่อยของกองทุนป้องกันความเสี่ยงสูง Deepseek เป็นเจ้าของศูนย์ข้อมูลซึ่งแตกต่างจากคู่แข่งที่พึ่งพาคลาวด์ส่งเสริมนวัตกรรมและการเพิ่มประสิทธิภาพที่เร็วขึ้น ธรรมชาติที่ได้รับการสนับสนุนตนเองมีส่วนช่วยในการตัดสินใจอย่างรวดเร็วและการตัดสินใจอย่างรวดเร็ว บริษัท ดึงดูดความสามารถสูงสุดโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปีส่วนใหญ่มาจากมหาวิทยาลัยจีน
รูปภาพ: Ensigame.com
ตัวเลข 6 ล้านดอลลาร์ซึ่งคิดเป็นค่าใช้จ่าย GPU ก่อนการฝึกอบรมก่อนการลงทุนโดยรวมอย่างมีนัยสำคัญเกินกว่า 500 ล้านดอลลาร์นับตั้งแต่เริ่มก่อตั้ง อย่างไรก็ตามโครงสร้างลีนของ Deepseek ช่วยให้มีนวัตกรรมที่มีประสิทธิภาพเมื่อเทียบกับคู่แข่งที่มีขนาดใหญ่และมีระบบราชการมากขึ้น
รูปภาพ: Ensigame.com
ความสำเร็จของ Deepseek เน้นถึงศักยภาพของ บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดี ในขณะที่การเรียกร้อง "งบประมาณการปฏิวัติ" นั้นสูงเกินจริงเนื้อหาที่คุ้มค่าเมื่อเทียบกับคู่แข่ง (เช่น 5 ล้านดอลลาร์สำหรับ R1 เทียบกับ $ 100 ล้านสำหรับ chatgpt4o) นั้นปฏิเสธไม่ได้ ความสำเร็จของมันมีสาเหตุมาจากการลงทุนที่สำคัญความก้าวหน้าทางเทคโนโลยีและทีมงานที่มีทักษะสูง