Zaskakująco niedrogie (ale bardzo finansowane) konkurent AI Deepseek
Deepseek, chiński startup AI, fale z nowym chatbotem, oferując imponujące możliwości przy rzekomo niskich kosztach. Wprowadzenie Chatbota: „Cześć, zostałem stworzony, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć”, odzwierciedla jego ambicje. Jego wpływ jest już widoczny, przyczyniając się do znacznego spadku ceny akcji NVIDIA.
Zdjęcie: engame.com
Sukces Deepseek V3 wynika z jego innowacyjnej architektury i metod szkoleniowych, obejmujących:
- Prognozowanie wielu tokenów (MTP): przewiduje wiele słów jednocześnie, zwiększając dokładność i wydajność.
- Mieszanka ekspertów (MOE): wykorzystuje 256 sieci neuronowych, aktywując osiem dla każdego tokena, przyspieszając szkolenie i poprawiając wydajność.
- Utrzymująca uwaga wielowłócona (MLA): Wielokrotnie koncentruje się na kluczowych częściach zdań, minimalizując utratę informacji i zwiększając dopracowane zrozumienie.
Deepseek początkowo domagał się kosztu szkolenia w wysokości zaledwie 6 milionów dolarów za pomocą 2048 GPU. Jednak semianaliza ujawniła znacznie większą infrastrukturę: około 50 000 GPU Nvidia Hopper (w tym jednostki H800, H100 i H20) rozłożonych na wiele centrów danych, o łącznej wartości około 1,6 miliarda dolarów inwestycji serwerów i 944 miliony dolarów na wydatki operacyjne.
Zdjęcie: engame.com
Deepseek, spółka zależna od funduszu hedgingowego o wysokiej zawartości flyerowej, jest właścicielem swoich centrów danych, w przeciwieństwie do konkurentów w chmurze, wspierając szybsze innowacje i optymalizację. Jego samofinansowany charakter przyczynia się do zwinności i szybkiego podejmowania decyzji. Firma przyciąga najlepsze talenty, a niektórzy badacze zarabiają ponad 1,3 miliona dolarów rocznie, głównie z chińskich uniwersytetów.
Zdjęcie: engame.com
Liczba 6 milionów dolarów, reprezentująca jedynie koszty GPU przed treningiem, znacząco zanika ogólną inwestycję, przekraczającą 500 milionów dolarów od jej powstania. Ludowa struktura Deepseek pozwala jednak na wydajne innowacje w porównaniu z większymi, bardziej biurokratycznymi konkurentami.
Zdjęcie: engame.com
Sukces Deepseek podkreśla potencjał dobrze finansowanych niezależnych firm AI. Podczas gdy roszczenie „rewolucyjnego budżetu” jest prawdopodobnie zawyżone, jego opłacalność w stosunku do konkurentów (np. 5 milionów USD za R1 vs. 100 milionów USD za Chatgpt4O) jest niezaprzeczalne. Jego osiągnięcie przypisuje się znacznym inwestycjom, postępom technologicznym i wysoko wykwalifikowanym zespołowi.