Малоизвестная китайская лаборатория искусственного интеллекта вызвала панику в Кремниевой долине после выпуска моделей искусственного интеллекта, которые могут превзойти лучшие американские, несмотря на то, что они дешевле и с менее мощными чипами.
В конце декабря лаборатория DeepSeek представила бесплатную модель с открытым исходным кодом на основе большой языковой модели, на создание которой, по ее словам, потребовалось всего два месяца и менее 6 миллионов долларов, при этом использовались чипы Nvidia H800 с пониженной производительностью.
Новые события вызвали тревогу по поводу того, что глобальное лидерство Америки в области искусственного интеллекта ослабевает, и поставили под сомнение огромные расходы больших технологий на создание моделей ИИ и центров обработки данных.
В ряде сторонних тестов модель DeepSeek превзошла модели Llama 3.1 от Meta, GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic в точности, начиная от решения сложных задач и заканчивая математикой и кодированием.
20.01.2024 г. DeepSeek выпустил r1 – модель искусственного мышления, которая также превзошла последнюю версию o1 от OpenAI во многих из сторонних тестов.
«Новая модель DeepSeek впечатляет тем, что они действительно эффективно создали модель с открытым исходным кодом, которая выполняет вычисления в режиме вывода и является суперэффективной», – сказал 22.01.2025 г. генеральный директор Microsoft, Сатья Наделла, на Всемирном экономическом форуме в Давосе (Швейцария). «Мы должны очень, очень серьезно относиться к разработкам Китая».
DeepSeek также пришлось преодолевать строгие ограничения на экспорт полупроводников, которые правительство США наложило на Китай, лишив страну доступа к самым мощным чипам, таким как H100 от Nvidia. Последние достижения говорят о том, что DeepSeek либо нашла способ обойти правила, либо экспортный контроль не был таким уж удушающим, как предполагал Вашингтон.
«Они могут взять действительно хорошую большую модель и использовать процесс, называемый дистилляцией», — сказал генеральный партнер Benchmark, Четан Путтагунта. «По сути, вы используете очень большую модель, чтобы помочь вашей маленькой модели стать умной в том, в чем вы хотите, чтобы она стала умной. Это на самом деле очень рентабельно».
О лаборатории и ее основателе Лян Вэньфэне известно немного. По сообщениям СМИ, DeepSeek появился на свет благодаря китайскому хедж-фонду High-Flyer Quant, который управляет активами на сумму около 8 миллиардов долларов.
Но DeepSeek – не единственная китайская компания, делающая успехи.
Ведущий исследователь в области искусственного интеллекта Кай-Фу Ли заявил, что его стартап 01.ai был обучен всего за 3 миллиона долларов. 22.01.2025 г. материнская компания TikTok, ByteDance, выпустила обновление своей модели, которая, как утверждается, превзошла o1 от OpenAI в ключевом бенчмарк-тесте.
«Необходимость – мать изобретения», – сказал генеральный директор Perplexity, Аравинд Шринивас. «Поскольку им пришлось искать обходные пути, в итоге они создали нечто гораздо более эффективное».
Источник: CNBC