На бумаге основной сигнал спроса на искусственный интеллект выглядит впечатляющим, но на самом деле он может быть значительно завышен. Компания Anthropic, устанавливая цены на свои инструменты с учетом этой реальности, может оказаться в наиболее выгодном положении среди всех компаний, занимающихся ИИ, если наступит коррекция.
Токены — это базовая единица использования ИИ: слова и символы, из которых состоят как запросы, отправляемые пользователями, так и результаты, генерируемые моделями.
Общение с ИИ потребляет несколько сотен токенов на абзац. Агентный ИИ, в котором модели пишут код, просматривают веб-страницы и выполняют многоэтапные рабочие процессы, расходует еще тысячи токенов за сеанс.
Исходя из тарифов последней модели Anthropic, один миллион токенов ввода (подсказок) стоит 5 долларов, а один миллион токенов вывода (ответов модели) — 25 долларов.
Компании, занимающиеся ИИ, ссылаются на бум потребления токенов, чтобы оправдать сотни миллиардов долларов, тратящихся на инфраструктуру для его обслуживания.
Но потребление токенов становится искаженным показателем.
Meta и Shopify заявляют, что создали внутренние рейтинги, которые отслеживают, сколько токенов используют сотрудники. Генеральный директор Nvidia, Дженсен Хуанг, заявил, что он был бы «глубоко встревожен», если бы инженер, зарабатывающий 500 000 долларов в год, не использовал вычислительных ресурсов на сумму не менее 250 000 долларов — оценивая, сколько инженер тратит на ИИ, а не то, что он с его помощью создает.
Как только компании начинают измерять внедрение ИИ по объему, сотрудники оптимизируют работу под этот показатель, а не под результат.
«Если ваша цель — просто потратить кучу денег, то для этого есть простые способы», — сказал Али Годси, генеральный директор компании Databricks, которая обрабатывает ИИ-задачи для тысяч предприятий. «Отправьте запрос еще десять раз. Настройте цикл, который будет повторять это снова и снова. Это будет стоить кучу денег и ни к чему не приведет».
Джен Стейв, исполнительный директор Института искусственного интеллекта Гарвардской школы бизнеса, слышит то же самое от руководителей предприятий.
«Я разговаривала с десятком технических директоров или директоров по информационным технологиям, и все они говорят: „На самом деле мне очень сложно найти модель рентабельности инвестиций“», — сказала она.
Компания Anthropic готовится к возможности того, что прогнозы спроса окажутся неверными.
Генеральный директор, Дарио Амодеи, описал то, что он называет «конусом неопределенности»: на строительство дата-центров уходит от одного до двух лет, поэтому компании сейчас вкладывают миллиарды в спрос, который они пока не могут подтвердить. Купите слишком мало — и потеряете клиентов, когда у вас не хватит мощностей. Купите слишком много — и доход не поступит в срок, а расчеты перестанут срабатывать.
«Если вы ошибетесь на пару лет, это может оказаться губительным», — сказал Амодей в подкасте Дваркеша Пателя в феврале. «У меня сложилось впечатление, что некоторые другие компании не заполняют листы расчетов. Они просто занимаются чем-то, потому что это звучит круто».
В ответ на это Anthropic отказался от фиксированной корпоративной цены и перешёл к оплате за токен, так что получаемый доход отражает фактическое использование. Компания также отказалась от некоторых сторонних инструментов, которые потребляли большое количество токенов, в то время как OpenAI делает ИИ дешевле и проще в использовании в больших масштабах.
Фиксированная цена доминировала в первые годы внедрения ИИ, предлагая фиксированные ежемесячные платежи за щедрый или неограниченный доступ к ИИ. Эта модель работала, когда люди общались с ИИ. Но использование агентов превратило то, что стоило тысячи токенов за сессию, в миллионы, и это подорвало экономику.
Самое щедрое предложение Anthropic для потребителей, тарифный план Max за 200 долларов в месяц, стало показательным примером.
Разработчики использовали эту подписку через сторонние инструменты для работы с агентами, такие как OpenClaw, агентов ИИ круглосуточно по тарифному плану, разработанному для общения. Согласно опубликованным тарифам Anthropic, для своей последней модели, активный пользователь Claude Code Max мог платить всего 200 долларов в месяц за использование, которое без подписки обошлось бы ему до 5000 долларов.
4 апреля Anthropic отключил эти инструменты. Борис Черный, глава Claude Code, написал в X, что подписки «не были созданы для моделей использования этих сторонних инструментов».
Такая же перенастройка происходит и в корпоративном сегменте.
В старых контрактах Anthropic предусматривались стандартные и премиум-лицензии — с фиксированной ежемесячной платой и встроенным лимитом использования. Согласно странице поддержки компании, теперь они обозначены как «устаревшие типы лицензий, которые больше не доступны для новых корпоративных контрактов». В новых корпоративных тарифах оплата взимается за каждую лицензию, а расход токенов оплачивается дополнительно по тарифам API.
Anthropic первым сделал этот шаг, но давление растет во всей отрасли.
Ник Терли (Nick Turley) из OpenAI, руководитель ChatGPT, признал в подкасте BG2, что «возможно, в нынешнюю эпоху наличие безлимитного тарифа — это все равно что иметь безлимитный тариф на электроэнергию. Это просто не имеет смысла».
Если теперь каждый токен имеет свою цену, компании и потребители, которые закладывали в бюджет фиксированную плату за ИИ, начнут задаваться вопросом, что они на самом деле получили за эти деньги.
Генеральный директор Ramp, Эрик Глиман, недавно запустивший инструмент для отслеживания токенов, рассматривает эту динамику с финансовой точки зрения.
За последний год расходы на ИИ среди клиентов Ramp выросли в 13 раз, и никто не знает, как это учесть в бюджете. Он указал на подход Anthropic как на более разумную долгосрочную стратегию и поднял вопрос, который должен беспокоить инвесторов OpenAI: если ваша бизнес-модель зависит от извлечения максимальной суммы расходов на токены, есть ли у вас стимул помогать клиентам более эффективно использовать ИИ?
Salesforce делает аналогичную ставку, внедряя новый показатель, который она называет «агентскими рабочими единицами» (agentic work units) и который отслеживает работу, выполняемую ИИ, а не токены, которые он расходует.
Ожидается, что Anthropic и OpenAI проведут IPO в этом году. Когда это произойдет, вопрос спроса станет первым, на что попытаются ответить инвесторы на публичном рынке.
Переход Anthropic на оплату за токен позволит получить более точные данные о том, что действительно ценят его клиенты. У OpenAI будут более высокие показатели, но будет сложнее доказать, насколько они соответствуют действительности.
Если даже значительная часть сегодняшнего спроса на ИИ завышена, то компания, которая установила цену с учетом реальности, останется на плаву, когда наступит коррекция.


Добавить комментарий