Как DeepSeek и модели с открытым исходным кодом меняют мир ИИ.

Технологические компании и учёные долгое время боролись с рисками и выгодами разработки программного обеспечения с открытым исходным кодом. Но ажиотаж вокруг генеративного искусственного интеллекта придал этим дебатам новый смысл.

DeepSeek и другие китайские компании выпустили целый ряд недорогих моделей с открытым исходным кодом, которые конкурируют с программным обеспечением ведущих американских разработчиков ИИ. В ответ OpenAI, ведущая американская компания в области ИИ, выпустила новую открытую модель, первую за шесть лет. Администрация Трампа призвала другие американские технологические компании последовать её примеру.

Вот что вам нужно знать.

Что такое открытый исходный код?

В целом, открытый исходный код — это программное обеспечение с исходным кодом, доступным для использования или модификации любым желающим. По данным Open Source Initiative (OSI), калифорнийской некоммерческой организации, которая отстаивает преимущества такого подхода, чтобы считаться открытым, программное обеспечение должно соответствовать определённым условиям распространения и доступа.

Чтобы модель ИИ считалась действительно открытой, OSI утверждает, что её разработчики должны предоставлять подробную информацию о данных, на которых она была обучена, и предоставлять людям возможность изучать, использовать и модифицировать систему в любых целях.

Закрытый исходный код, напротив, относится к программному обеспечению и моделям, которые контролируются разработчиком, не могут быть изменены и обеспечивают меньшую прозрачность в отношении их технической основы.

Предлагают ли ведущие разработчики ИИ программное обеспечение с открытым исходным кодом?

Многие технологические компании позиционируют свое программное обеспечение для искусственного интеллекта как программное обеспечение с открытым исходным кодом; не все согласны с тем, что все они соответствуют этому определению.

Meta Platforms Inc., французский стартап Mistral, а теперь и DeepSeek выпустили модели ИИ, которые они называют моделями с открытым исходным кодом.

Но часто такие модели на самом деле являются моделями с открытыми весами. Это означает, что помимо предоставления самой модели и, возможно, части её исходного кода, компании раскрывают веса — то есть множество числовых значений, которые модель получила и которые она доработала в процессе обучения, что позволяет разработчикам лучше настраивать её, — но не раскрывают подробности о данных, фактически использованных для её обучения.

Например, Meta предлагает весовые коэффициенты и часть исходного кода для своей серии ИИ-моделей Llama, но не предоставляет подробную информацию об обучающих данных. Ранее Meta также подвергалась критике со стороны OSI за условия лицензирования, которые включают определённые ограничения на коммерческое использование.

Аналогичным образом, в январе DeepSeek заявил, что выпустила свою последнюю систему R1 как модель с открытым исходным кодом, но не предоставила ни кода, ни обучающих данных. Это вызвало вопросы о том, что именно компания могла использовать для создания своей модели.

OpenAI, несмотря на слово «открытый» в названии, не открывает исходный код большинства своих моделей. Однако вскоре после вирусного успеха DeepSeek генеральный директор OpenAI, Сэм Альтман, признал, что создателю ChatGPT необходимо «разработать другую стратегию использования открытого исходного кода». Он добавил: «Лично я считаю, что мы оказались на неправильной стороне истории».

В августе компания OpenAI выпустила две модели, GPT-oss-120b и GPT-oss-20b, представляющие собой системы с открытыми весами, аналогичные Llama. Модели доступны на платформе хостинга программного обеспечения для ИИ, Hugging Face. Модели могут имитировать процесс человеческого мышления и генерировать текст (но не изображения или видео) в ответ на запросы пользователя.

В чём преимущества открытого исходного кода?

Сторонники открытого исходного кода обычно рекламируют его как более доступное для пользователей, поскольку оно не требует одинаковых лицензионных сборов. Более низкие цены открывают путь для более широкого внедрения ИИ, а снижение затрат на разработку способствует инновациям. Сторонники также отмечают, что такой подход повышает ответственность разработчиков, создающих мощные системы ИИ, предоставляя другим возможность лучше понимать, как работают модели.

Закрытые системы создают риск того, что на рынке ИИ будет доминировать несколько влиятельных компаний. Аарон Леви, генеральный директор компании Box Inc., занимающейся облачным хранением данных, заявил: «В мире очень дорогого и проприетарного ИИ поставщики ИИ могли бы и, вероятно, должны были бы оставить всю экономическую выгоду себе, фактически вытесняя разработчиков и экосистему».

Для таких компаний, как Meta, открытый исходный код имеет дополнительное преимущество: популярность. Предоставляя другим разработчикам доступ к своему открытому программному обеспечению и возможность его разработки, Meta смогла расширить свое влияние в экосистеме ИИ.

Каковы риски открытых систем?

Критики программного обеспечения с открытым исходным кодом утверждают, что оно менее безопасно. Что касается искусственного интеллекта, то некоторые в США опасаются, что использование подобных моделей конкурентами, такими как Китай, представляет угрозу для национальной безопасности, угрожая безопасности граждан. Например, модели, которые собирают огромные объемы пользовательских данных, могут быть использованы для целей слежки. Есть опасения, что американские компании, предлагающие свои модели искусственного интеллекта с разной степенью открытости, потенциально могут дать конкурирующим странам возможность использовать их для технологического превосходства над США.

Почему DeepSeek пошёл по «открытому» пути?

Используя более открытый подход (с некоторыми оговорками), DeepSeek, возможно, ослабил некоторые опасения глобальных пользователей по поводу жесткого контроля Китая над технологией. Стартап также, вероятно, расширил охват своего чат-бота на западных рынках, упростив другим разработчикам адаптацию базовой технологии для удовлетворения своих потребностей.

Другими словами, DeepSeek эффективно следовал тому же принципу, что и Meta, чтобы охватить большую часть экосистемы искусственного интеллекта — факт, который, похоже, не остался незамеченным генеральным директором Meta, Марком Цукербергом.

«Это огромное геополитическое соревнование, и Китай в нём участвует очень активно», — сказал Цукерберг в интервью The Joe Rogan Experience. «Если и должна быть модель с открытым исходным кодом, которой будут пользоваться все, то мы должны выбрать американскую модель».

Как же работает модель ИИ DeepSeek?

Как и некоторые из последних моделей ведущих американских разработчиков, включая OpenAI и Google, DeepSeek R1 призван имитировать человеческие размышления над задачами, тратя время на вычисление ответа, прежде чем отвечать на запросы пользователей. Однако версия DeepSeek, созданная на основе одной из недавно выпущенных моделей компании, V3, отличается от своих американских аналогов своей эффективностью.

Команда, стоящая за ней, работала инновационно. В то время как конкуренты использовали огромное количество мощных компьютерных чипов для создания аналогичных моделей ИИ, команда DeepSeek, похоже, нашла способы эффективно использовать относительно небольшое количество менее продвинутых чипов, к которым они получили доступ благодаря экспортному контролю США на самые передовые чипы. Они активно использовали метод, известный как обучение с подкреплением, который вознаграждает систему за правильные ответы и наказывает за неправильные.

В США некоторые лидеры в области технологий и политики признали эти достижения, одновременно задаваясь вопросом о том, не построила ли китайская компания свой чат-бот на основе западных технологий, избежав при этом огромных затрат на разработку крупных языковых моделей, составляющих основу чат-ботов.

Что говорили официальные лица об открытых исходных кодах?

В 2024 году администрация тогдашнего президента Джо Байдена, проведя анализ, пришла к выводу, что вводить ограничения на открытые модели ИИ преждевременно, но при этом не исключила возможности того, что в будущем могут возникнуть основания для этого.

Администрация Дональда Трампа оказала определённую поддержку моделям с открытым исходным кодом и открытыми весами, вероятно, в ответ на опасения по поводу доминирования ИИ из Китая. В Плане действий Трампа в области ИИ, опубликованном в июле, Белый дом поощряет разработку открытых моделей, ссылаясь на их потенциал «стать мировыми стандартами» в бизнесе и академических исследованиях. «По этой причине, — говорится в плане, — они также имеют геостратегическое значение».

Webno