Интересно, как выглядит персидский кот, стоящий на пляже в кожаной куртке и ковбойской шляпе и играющий на гитаре? Человеческому мозгу трудно представить себе эту абсурдную ситуацию. С другой стороны, у искусственного интеллекта (ИИ) нет проблем с визуализацией: Система от Google под названием Imagen превращает текстовый ввод любого вида в фотореалистичные изображения.
Это лишь один из примеров огромных успехов, достигнутых технологией в настоящее время. Системы искусственного интеллекта могут писать стихи и статьи, создавать программный код и проектировать веб-сайты на замечательном уровне. Один из сотрудников Google недавно даже поверил, что у языковой модели LaMDA появилось сознание.
Однако эта технология работает только на английском или мандаринском языках: системы с большими нейронными сетями, такие как Imagen, которые вызывают фурор среди ученых, в основном поставляются американскими и китайскими компаниями и исследовательскими институтами. Германия снова осталась в стороне от последней тенденции.
Группа немецких компаний, исследовательских институтов и ассоциаций хочет это изменить — и призывает к политической поддержке: инициатива LEAM, в которой участвуют, в частности, Bayer, Bosch, Continental, Eon, SAP и T-Systems, в текущем концептуальном документе призывает создать суперкомпьютер, пригодный для обучения больших моделей ИИ.
Для Йорга Бинерта, президента AI Bundesverband и со-инициатора LEAM, это вопрос огромной важности: "В Европе мы сталкиваемся с проблемой потери контроля над развитием и теряем еще одну часть нашего цифрового суверенитета".
Например, модели американских и китайских производителей не являются ни открытыми, ни прозрачными, а также существует лишь ограниченная поддержка таких языков, как немецкий или французский. Поэтому существует риск возникновения зависимости.
Расходы оцениваются как минимум в 375 миллионов евро в течение пяти лет. Теперь необходимо заручиться поддержкой политиков, сказал Бинерт в интервью газете Handelsblatt. Уже налажен обмен с Федеральным министерством экономики и защиты климата.
Гонка вооружений нейронных сетей.
Нынешняя шумиха вокруг искусственного интеллекта была спровоцирована Open AI: В июне 2020 года компания опубликовала GPT-3, языковую модель, характеристики которой вызвали сенсацию в СМИ и среди экспертов.
Искусственная нейронная сеть работает в фоновом режиме. Она содержит 175 миллиардов параметров, то есть узлов, в сто раз больше, чем предыдущая версия. Программисты загрузили 570 гигабайт мировых знаний — от Википедии до оцифрованных книг и журналов и текстов из Интернета. Этот объем превышает размер Библии в 380 000 раз.
По мнению экспертов, размер модели в сочетании с огромным количеством данных привел к прорыву: искусственный интеллект неожиданно смог иметь дело с языком. Без понимания содержания, заметьте: модель использует статистические методы, чтобы вычислить, какие слова идут следующими. Это вопрос расчета вероятности.
Выход GPT-3 стал началом гонки вооружений. В последующие месяцы несколько поставщиков технологий и исследовательских институтов опубликовали дополнительные модели. В настоящее время самыми крупными являются Wu Dao 2.0 от Пекинской академии искусственного интеллекта (BAAI) с 1,75 триллионами и Switch Transformers от Google с 1,6 миллиардами параметров. Европа практически осталась в стороне от этой гонки вооружений: Единственная компания в первой десятке — немецкий стартап Aleph Alpha.
Развитие в Европе происходит слишком медленно, заключает LEAM в концептуальном документе, — это не соответствует социальной и экономической значимости новой технологии. Поэтому необходимы согласованные действия. Потому что: "Было бы опасно и халатно оставлять развитие технологий на откуп крупным технологическим корпорациям США и Китая".
Усилия, безусловно, предпринимаются. Например, правительство Германии финансирует проект Open GPT-X в размере 15 миллионов евро, в рамках которого десять организаций из бизнеса и науки в сотрудничестве с Институтом Фраунгофера IAIS, хотят разработать языковые модели. Однако не хватает "инфраструктуры, предназначенной для разработки крупных моделей ИИ, чтобы начать успешную гонку за лидерство".
"Обучение большой модели может занять несколько недель", — сказал Бинерт. По его словам, немецким разработчикам трудно получить необходимые вычислительные мощности. Хотя в исследовательском центре Юлиха есть суперкомпьютер, он используется в основном для моделирования в различных научных областях. Каждый, кто хочет получить доступ к системе, сначала должен подать сложное заявление.
Новый суперкомпьютер для Европы.
Именно поэтому инициатива предусматривает создание специального суперкомпьютера для искусственного интеллекта, например, для обучения больших моделей. "Мы будем рады, если он начнется в начале-середине 2023 года", — сказал Бинерт. Однако, по его словам, существуют проблемы с поставками оборудования из-за нехватки микросхем. "Вот почему мы должны еще больше спешить с получением разрешения".
Будет ли LEAM успешным, пока неясно — участники пока подписали только декларации о намерениях. Тем не менее, есть большой интерес, о чем свидетельствует широкое участие в общей сложности 40 исследовательских институтов, стартапов и крупных компаний. Только семь компаний из DAX поддерживают эту инициативу.
Здесь играют роль различные соображения. SAP, например, использует искусственный интеллект для улучшения собственного программного обеспечения. Группа встраивает в свои программы алгоритмы для автоматического сопоставления входящих платежей со счетами или классификации электронных писем клиентов, что значительно повышает эффективность бизнес-процессов.
Клиенты должны обучить алгоритмы на своих собственных данных, прежде чем использовать их. Эти усилия значительно сокращаются с большими моделями, что значительно упрощает внедрение, говорит Фей Ю Сюй, который отвечает за технологию в качестве "глобального руководителя искусственного интеллекта". "Это как распознавание лиц на мобильном телефоне: несколько раз посмотрите в камеру — и все".
Для энергетической компании Eon искусственный интеллект важен для автоматизации взаимодействия с клиентами, например, с помощью чат-ботов. "Для этого нам нужны высококачественные языковые модели, которые в идеале были бы обучены на немецких текстах", - говорится в статье. Большинство ведущих систем, однако, были обучены на английских данных и поэтому лучше всего работают с английскими разговорами — LEAM призвана расширить фокус.
Дочерняя компания Telekom T-Systems, напротив, подчеркивает важность прозрачности: такие модели, как GPT-3, являются "черными ящиками", объясняет компания. LEAM. С другой стороны, обещает уделять внимание таким аспектам, как прозрачность и устойчивость — другими словами, тому, что часто подпадает под европейские ценности. Это должно облегчить экспертам понимание того, как возникают искажения в результатах.