24 апреля, китайский стартап в области искусственного интеллекта DeepSeek выпустил предварительную версию своей долгожданной большой языковой модели V4, позволяющую пользователям протестировать ее новые возможности и функции.
Этот релиз состоялся более чем через год после того, как компания из Ханчжоу представила свою модель рассуждений R1, которая потрясла мировые технологические рынки благодаря своей удивительной производительности и экономичности.
Как и предыдущие версии моделей DeepSeek, последнее обновление является открытым исходным кодом, что позволяет разработчикам скачивать код, запускать его локально и модифицировать.
Модель доступна в версиях «pro» и «flash» в зависимости от размера. DeepSeek утверждает, что V4 демонстрирует высокую производительность по сравнению с местными конкурентами, особенно в задачах, основанных на агентах, обработке знаний и выводах.
«Предварительная версия DeepSeek V4 — это серьезный прорыв», предлагающий более низкие затраты на вывод, чем предыдущие модели, — заявил CNBC Нил Шах, вице-президент по исследованиям в Counterpoint Research.
Затраты на вывод результатов — это вычислительные и финансовые расходы на запуск обученной модели ИИ для генерации выходных данных.
Под затратами на инференцию понимаются вычислительные и финансовые затраты, связанные с запуском обученной модели ИИ для генерации результатов.
В DeepSeek также сообщили, что V4 был оптимизирован для использования с популярными инструментами для создания агентов, такими как Claude Code от Anthropic и OpenClaw.
По словам главного аналитика по ИИ в Counterpoint, Вэй Суна, результаты тестирования V4 указывают на то, что он может обеспечить «превосходные возможности агента при значительно более низких затратах».
Сможет ли DeepSeek снова поразить мир?
Основанная в 2023 году, компания DeepSeek привлекла к себе внимание в конце 2024 года благодаря своей бесплатной модели V3 с открытым исходным кодом, которая, по ее утверждению, была обучена с использованием менее мощных чипов и при затратах, составляющих лишь небольшую часть стоимости моделей, созданных такими компаниями, как OpenAI и Google.
Через несколько недель, в январе 2025 года, компания выпустила модель рассуждений R1, которая показала аналогичные результаты в тестах или превзошла многие ведущие в мире LLM.
Модель R1 встревожила инвесторов, когда DeepSeek заявил, что на ее создание с использованием чипов Nvidia меньшей мощности ушло всего два месяца и менее 6 миллионов долларов. Это поставило под сомнение лидерство США в области ИИ, а также огромные расходы крупных технологических компаний на инфраструктуру ИИ.
С тех пор DeepSeek выпустил ряд обновлений модели, но ни одно из них не смогло повторить успех R1.
Дебют V4 вряд ли окажет такое же влияние на рынок, как R1, поскольку трейдеры уже учли тот факт, что китайский ИИ конкурентоспособен и дешевле в использовании, заявил Иван Су, старший аналитик по акциям Morningstar.
Однако, по словам Су, последняя позиция DeepSeek ставит другие китайские модели с открытым исходным кодом в качестве прямых конкурентов.
«Такой постановки вопроса не было в случае с R1, и уже одно это говорит о том, насколько усилилась конкуренция на внутреннем рынке», — добавил он.
С момента выпуска R1, компания DeepSeek столкнулась с усилением конкуренции в бурно развивающемся секторе искусственного интеллекта Китая, где такие игроки, как Alibaba и ByteDance, также выпустили в этом году новые модели.
Акции ряда других китайских компаний, работающих в сфере ИИ, 24 апреля, упали на Гонконгской бирже. Акции MiniMax и Knowledge Atlas Technology, также известной как Zhipu, упали примерно на 8%, а акции разработчика Manycore Tech из Ханчжоу — на 9%.
Какие чипы использовались для обучения V4?
Один из главных вопросов, связанных с выпуском модели DeepSeek V4, заключается в том, какие чипы использовались для её обучения и поддержки.
24 апреля, китайский технологический гигант Huawei подтвердил, что его новейший вычислительный кластер для ИИ, работающий на процессорах Ascend AI, может поддерживать модель DeepSeek V4.
Однако остается неясным, сколько именно чипов Huawei было использовано при обучении, по сравнению с чипами Nvidia.
В связи с экспортным контролем со стороны США китайским разработчикам запрещено напрямую приобретать самые передовые чипы Nvidia для искусственного интеллекта.
Между тем Пекин активизировал усилия по развитию собственной чип-индустрии и, по имеющимся данным, подталкивает китайские технологические компании к использованию отечественных альтернатив от таких производителей, как Huawei, вместо зарубежных аналогов.
Вэй Сунь из Counterpoint отметила, что способность V4 работать на местных чипах может иметь огромные последствия, помогая Пекину добиться большей независимости в сфере ИИ и еще больше снизить зависимость от Nvidia.
«В конечном итоге это также ускорит развитие ИИ во всем мире», — добавила она.
После того как DeepSeek объявил о выпуске V4, акции китайских контрактных производителей микросхем выросли в Гонконге: SMIC и Hua Hong Semiconductor поднялись на 8,9% и 15,2% соответственно.


Добавить комментарий