Đối thủ cạnh tranh AI giá cả phải chăng đáng ngạc nhiên (nhưng được tài trợ ồ ạt)
Deepseek, một công ty khởi nghiệp AI của Trung Quốc, đã tạo nên làn sóng với chatbot mới của mình, tự hào với khả năng ấn tượng với chi phí thấp có chủ đích. Lời giới thiệu của Chatbot: "Xin chào, tôi đã được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên", phản ánh tham vọng của nó. Tác động của nó đã rất rõ ràng, góp phần làm giảm đáng kể giá cổ phiếu của NVIDIA.
Hình ảnh: Ensigame.com
Thành công của Deepseek V3 xuất phát từ các phương pháp đào tạo và kiến trúc sáng tạo của nó, kết hợp:
- Dự đoán đa điểm (MTP): Dự đoán đồng thời nhiều từ, tăng độ chính xác và hiệu quả.
- Hỗn hợp các chuyên gia (MOE): Sử dụng 256 mạng thần kinh, kích hoạt tám cho mỗi mã thông báo, tăng tốc đào tạo và cải thiện hiệu suất.
- Sự chú ý tiềm ẩn đa đầu (MLA): Liên tục tập trung vào các phần câu chính, giảm thiểu mất thông tin và nâng cao sự hiểu biết sắc thái.
Deepseek ban đầu tuyên bố chi phí đào tạo chỉ 6 triệu đô la bằng GPU 2048. Tuy nhiên, Semianalysis cho thấy một cơ sở hạ tầng lớn hơn nhiều: khoảng 50.000 GPU phễu NVIDIA (bao gồm H800, H100 và H20 đơn vị) đã trải rộng trên nhiều trung tâm dữ liệu, tổng cộng khoảng 1,6 tỷ đô la đầu tư máy chủ và 944 triệu đô la chi phí hoạt động.
Hình ảnh: Ensigame.com
Một công ty con của quỹ phòng hộ cao, Deepseek sở hữu các trung tâm dữ liệu của mình, không giống như các đối thủ cạnh tranh dựa trên đám mây, thúc đẩy sự đổi mới và tối ưu hóa nhanh hơn. Bản chất tự tài trợ của nó góp phần vào sự nhanh nhẹn và ra quyết định nhanh chóng. Công ty thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu từ các trường đại học Trung Quốc.
Hình ảnh: Ensigame.com
Con số 6 triệu đô la, chỉ đại diện cho chi phí GPU trước khi đào tạo, đánh giá cao đáng kể khoản đầu tư chung, vượt quá 500 triệu đô la kể từ khi thành lập. Tuy nhiên, cấu trúc tinh gọn của Deepseek cho phép đổi mới hiệu quả so với các đối thủ lớn hơn, quan liêu hơn.
Hình ảnh: Ensigame.com
Thành công của Deepseek nhấn mạnh tiềm năng của các công ty AI độc lập được tài trợ tốt. Mặc dù yêu cầu "Ngân sách Cách mạng" được cho là tăng cường, hiệu quả chi phí của nó so với các đối thủ cạnh tranh (ví dụ: 5 triệu đô la cho R1 so với 100 triệu đô la cho TATGPT4O) là không thể phủ nhận. Thành tích của nó được quy cho đầu tư đáng kể, tiến bộ công nghệ và một nhóm có tay nghề cao.