Как новая китайская модель ИИ, DeepSeek, угрожает доминированию США?

Китайская модель искусственного интеллекта, DeepSeek,

Малоизвестная китайская лаборатория искусственного интеллекта вызвала панику в Кремниевой долине после выпуска моделей искусственного интеллекта, которые могут превзойти лучшие американские, несмотря на то, что они дешевле и с менее мощными чипами.

В конце декабря лаборатория DeepSeek представила бесплатную модель с открытым исходным кодом на основе большой языковой модели, на создание которой, по ее словам, потребовалось всего два месяца и менее 6 миллионов долларов, при этом использовались чипы Nvidia H800 с пониженной производительностью.

Новые события вызвали тревогу по поводу того, что глобальное лидерство Америки в области искусственного интеллекта ослабевает, и поставили под сомнение огромные расходы больших технологий на создание моделей ИИ и центров обработки данных.

В ряде сторонних тестов модель DeepSeek превзошла модели Llama 3.1 от Meta, GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic в точности, начиная от решения сложных задач и заканчивая математикой и кодированием.

20.01.2024 г. DeepSeek выпустил r1 – модель искусственного мышления, которая также превзошла последнюю версию o1 от OpenAI во многих из сторонних тестов.

«Новая модель DeepSeek впечатляет тем, что они действительно эффективно создали модель с открытым исходным кодом, которая выполняет вычисления в режиме вывода и является суперэффективной», – сказал 22.01.2025 г. генеральный директор Microsoft, Сатья Наделла, на Всемирном экономическом форуме в Давосе (Швейцария). «Мы должны очень, очень серьезно относиться к разработкам Китая».

DeepSeek также пришлось преодолевать строгие ограничения на экспорт полупроводников, которые правительство США наложило на Китай, лишив страну доступа к самым мощным чипам, таким как H100 от Nvidia. Последние достижения говорят о том, что DeepSeek либо нашла способ обойти правила, либо экспортный контроль не был таким уж удушающим, как предполагал Вашингтон.

«Они могут взять действительно хорошую большую модель и использовать процесс, называемый дистилляцией», — сказал генеральный партнер Benchmark, Четан Путтагунта. «По сути, вы используете очень большую модель, чтобы помочь вашей маленькой модели стать умной в том, в чем вы хотите, чтобы она стала умной. Это на самом деле очень рентабельно».

О лаборатории и ее основателе Лян Вэньфэне известно немного. По сообщениям СМИ, DeepSeek появился на свет благодаря китайскому хедж-фонду High-Flyer Quant, который управляет активами на сумму около 8 миллиардов долларов.

Но DeepSeek – не единственная китайская компания, делающая успехи.

Ведущий исследователь в области искусственного интеллекта Кай-Фу Ли заявил, что его стартап 01.ai был обучен всего за 3 миллиона долларов. 22.01.2025 г. материнская компания TikTok, ByteDance, выпустила обновление своей модели, которая, как утверждается, превзошла o1 от OpenAI в ключевом бенчмарк-тесте.

«Необходимость – мать изобретения», – сказал генеральный директор Perplexity, Аравинд Шринивас. «Поскольку им пришлось искать обходные пути, в итоге они создали нечто гораздо более эффективное».

Источник: CNBC