Удивительно доступный (но в то же время финансируемый) конкурент DeepSeek (но в то же время финансируется).
Deepseek, китайский стартап ИИ, сделал волны со своим новым чатботом, обладая впечатляющими возможностями по якобы низкой стоимости. Введение Чатбота: «Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас», отражает его амбиции. Его влияние уже очевидно, что способствует значительному снижению цены акций Nvidia.
Изображение: Ensigame.com
Успех DeepSeek V3 связан с его инновационной архитектурой и методами обучения, включающим:
- Предсказание с несколькими точками (MTP): предсказывает несколько слов одновременно, повышение точности и эффективности.
- Смесь экспертов (MOE): использует 256 нейронных сетей, активируя восемь для каждого токена, ускоряя обучение и повышение производительности.
- Многопользовательское скрытое внимание (MLA): неоднократно фокусируется на ключевых частях предложения, минимизирует потерю информации и улучшая нюансированное понимание.
Первоначально DeepSeek потребовал стоимость обучения всего в 6 миллионов долларов, используя 2048 графических процессоров. Тем не менее, полуанализа выявил гораздо большую инфраструктуру: приблизительно 50 000 графических процессоров Nvidia Hopper (включая H800, H100 и H20), распространяющиеся по нескольким центрам обработки обработки данных, составляя около 1,6 млрд. Долл. США в инвестициях в сервер и 944 млн. Долл.
Изображение: Ensigame.com
Дочерняя компания Хедж-фонда с высоким содержанием лада, Deepseek владеет своими центрами обработки данных, в отличие от конкурентов-облачных, способствующих более быстрым инновациям и оптимизации. Его самофинансируемая природа способствует ловкости и быстрому принятию решений. Компания привлекает лучших талантов, некоторые исследователи зарабатывают более 1,3 миллиона долларов в год, в основном из китайских университетов.
Изображение: Ensigame.com
Цифра в 6 миллионов долларов, представляющая только предварительные затраты на графический процессор, значительно снижает общие инвестиции, превышающие 500 миллионов долларов с момента его создания. Продолжающая структура Deepseek, однако, обеспечивает эффективные инновации по сравнению с более крупными, более бюрократическими конкурентами.
Изображение: Ensigame.com
Успех DeepSeek подчеркивает потенциал хорошо финансируемых независимых компаний искусственного интеллекта. Хотя утверждение «революционного бюджета», возможно, завышен, его экономическая эффективность относительно конкурентов (например, 5 миллионов долларов за 1 r1 против 100 млн. Долл. США для CHATGPT4O) неоспорима. Его достижение связано с существенными инвестициями, технологическими достижениями и высококвалифицированной командой.