Конкуренты — компании OpenAI, Anthropic PBC и Google (входит в Alphabet Inc.) — начали сотрудничать, чтобы пресечь попытки китайских конкурентов извлекать результаты из передовых американских моделей искусственного интеллекта с целью получить преимущество в глобальной гонке в сфере ИИ.
По словам осведомленных источников, компании обмениваются информацией через Frontier Model Forum — отраслевую некоммерческую организацию, основанную этими тремя технологическими компаниями совместно с Microsoft Corp. в 2023 году, — с целью выявления так называемых попыток «враждебной дистилляции», нарушающих их условия предоставления услуг.
Это редкое сотрудничество подчеркивает серьезность опасений, высказанных американскими компаниями, занимающимися ИИ, что некоторые пользователи, особенно в Китае, создают поддельные версии их продуктов, которые могут подрезать их по цене и увести клиентов, одновременно создавая угрозу национальной безопасности. По оценкам американских чиновников, несанкционированная дистилляция обходится лабораториям Кремниевой долины в миллиарды долларов годовой прибыли, по словам человека, знакомого с этими выводами, который описал их на условиях анонимности.
OpenAI подтвердила, что участвует в обмене информацией по вопросам враждебной дистилляции в рамках Frontier Model Forum, и сослалась на недавнее письмо, направленное ею в Конгресс по данному вопросу, в котором компания обвинила китайскую фирму DeepSeek в попытке «бесплатно воспользоваться возможностями, разработанными OpenAI и другими передовыми лабораториями США». Google, Anthropic и Frontier Model Forum отказались от комментариев.
Дистилляция — это метод, при котором более старая модель ИИ, выступающая в роли «учителя», используется для обучения новой модели, «ученика», которая воспроизводит возможности более ранней системы — зачастую с гораздо меньшими затратами, чем при создании оригинальной модели с нуля. Некоторые формы дистилляции широко признаны и даже поощряются лабораториями ИИ, например, когда компании создают более компактные и эффективные версии своих собственных моделей или позволяют сторонним разработчикам использовать дистилляцию для создания неконкурентных технологий.
Тем не менее, дистилляция вызывает споры, когда ее используют третьи стороны — особенно в таких странах-противниках, как Китай или Россия — для несанкционированного копирования проприетарных разработок. Ведущие американские лаборатории ИИ предупреждают, что иностранные противники могут использовать эту технику для разработки моделей ИИ, лишенных защитных механизмов, таких как ограничения, которые не позволяют пользователям создавать смертоносные патогены.
Большинство моделей, разработанных китайскими лабораториями, относятся к категории «open weight», то есть отдельные компоненты лежащей в их основе системы искусственного интеллекта доступны для свободного скачивания и запуска на собственных платформах, что делает их использование более экономичным. Это создает экономические трудности для американских компаний, занимающихся ИИ, которые сохраняют свои модели в закрытом доступе, рассчитывая, что клиенты будут платить за доступ к их продуктам и помогут окупить сотни миллиардов долларов, потраченных на центры обработки данных и другую инфраструктуру.
Впервые дистилляция привлекла к себе пристальное внимание в январе 2025 года, через несколько недель после неожиданного выпуска DeepSeek модели рассуждений R1, которая произвела фурор в мире ИИ. Вскоре после этого Microsoft и OpenAI провели расследование, чтобы выяснить, не похищал ли китайский стартап большие объемы данных из моделей американской компании для создания R1, как ранее сообщал Bloomberg.
В феврале OpenAI предупредила американских законодателей, что DeepSeek продолжал использовать все более изощренные тактики для извлечения результатов из американских моделей, несмотря на усиленные меры по предотвращению неправомерного использования ее продуктов. В своем меморандуме Специальному комитету Палаты представителей по Китаю OpenAI заявила, что DeepSeek полагается на дистилляцию для разработки новой версии своего революционного чат-бота.
Обмен информацией между американскими компаниями, занимающимися искусственным интеллектом, по вопросам «враждебной дистилляции» напоминает стандартную практику в сфере кибербезопасности, где компании регулярно обмениваются данными об атаках и тактиках злоумышленников с целью укрепления сетевой защиты. Сотрудничая друг с другом, компании в сфере ИИ стремятся аналогичным образом более эффективно выявлять такие действия, устанавливать виновных и пресекать попытки несанкционированных пользователей.
Чиновники администрации Трампа продемонстрировали свою готовность содействовать обмену информацией между компаниями, занимающимися ИИ, с целью сдерживания «враждебной дистилляции». План действий в области ИИ, обнародованный президентом Дональдом Трампом в прошлом году, предусматривал создание центра обмена и анализа информации, в том числе для этой цели.
По словам осведомленных источников, на данный момент обмен информацией о дистилляции остается ограниченным из-за неопределенности компаний, занимающихся ИИ, относительно того, какой объем информации можно передавать в рамках существующих антимонопольных рекомендаций для противодействия конкурентной угрозе со стороны Китая. По словам этих источников, компаниям было бы полезно получить более четкие указания от правительства США.
Дистилляция стала одной из главных проблем для американских разработчиков ИИ с тех пор, как DeepSeek потряс мировые рынки в начале 2025 года выпуском своей версии R1. В Китае продолжают появляться высокопроизводительные модели с открытым исходным кодом, и многие в отрасли внимательно следят за крупным обновлением модели DeepSeek.
В прошлом году Anthropic заблокировал использование своей модели чат-бота Claude компаниями, контролируемыми Китаем, а в феврале выявил три китайские лаборатории ИИ — DeepSeek, Moonshot и MiniMax — которые незаконно извлекали возможности модели путем дистилляции. В этом году Anthropic заявил, что угроза «выходит за рамки какой-либо отдельной компании или региона» и представляет собой угрозу национальной безопасности, поскольку дистиллированные модели часто не имеют защитных механизмов, предназначенных для предотвращения использования злоумышленниками инструментов ИИ в вредоносных целях.
Google опубликовал в блоге сообщение о том, что зафиксировал рост числа попыток извлечения моделей. Три американские лаборатории ИИ пока не предоставили доказательств того, насколько инновации Китая в области моделей зависят от дистилляции, но отмечают, что распространенность атак можно оценить по объему запросов на крупномасштабные данные.


Добавить комментарий