Сегодня 02 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Компании начали считать деньги при внедрении ИИ, во многих случаях оно замедляется

В сфере внедрения генеративного искусственного интеллекта, как отмечает Financial Times, наметились важные структурные изменения, которые заставляют клиентов пересматривать свой подход к финансированию процесса. Агентские решения вызывают рост расходов корпораций, и теперь они начали более вдумчиво оплачивать внедрение ИИ.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Во многом такому перелому способствовала политика разработчиков ИИ типа OpenAI и Anthropic, которые после анализа собственных затрат поняли, что субсидируют многих клиентов, предоставляя им почти неограниченный доступ к вычислительным ресурсам в рамках подписки. Многие клиенты потребляют так много токенов, что расходы не покрываются выплатами в форме абонентской платы. Переход на соразмерную оплату потребляемых вычислительных ресурсов ужаснул многих клиентов. Например, небольшой разработчик ПО Workato после перехода на пропорциональную оплату токенов столкнулся с тем, что расходы на оплату услуг провайдеров ИИ в первый день выросли в семь раз. С этим явно нужно было что-то делать, и руководство компании стало два раза в неделю анализировать возможности сэкономить на использовании ИИ.

В целом, как отмечает Financial Times, тактика потребителей систем ИИ сводится как к ограничению использования сторонних инструментов, за которые надо платить, так и к поиску более дешёвых альтернатив. В некоторых случаях последними становятся либо разворачиваемые на собственной инфраструктуре ИИ-модели с открытым исходным кодом, либо более доступные системы тех же китайских разработчиков. В условиях удалённого доступа китайские решения могут быть дешевле хотя бы в силу более низких тарифов на электроэнергию в КНР. С начала этого года китайские ИИ-модели обошли американских по объёму потребления токенов.

Некоторые представители бизнеса ввели лимиты расходов на использование стороннего ИИ своими сотрудниками. Например, в Uber данная сумма ограничена $1500 на одного сотрудника в месяц. Расходы выросли по мере перехода пользователей от простого взаимодействия с чат-ботами к применению множественных ИИ-агентов. На одного человека в организации могут приходиться от 10 до 10 000 агентов, и все они непрерывно потребляют токены, за которые нужно платить. Аналитики Goldman Sachs ожидают, что к 2030 году потребление ИИ-токенов вырастет в 24 раза, и это само по себе усугубит дефицит чипов в ближайшие полтора года.

Даже располагающие собственной вычислительной инфраструктурой компании типа Amazon (AWS) начали следить за эффективностью использования ресурсов. Этот облачный гигант начал бороться с фиктивной демонстрацией бурной ИИ-деятельности некоторыми сотрудниками, которые рассчитывали продемонстрировать руководству лояльность идее всеобщего погружения в такую активность. Meta пришлось последовать примеру конкурента в апреле этого года. В любом случае, даже Amazon и Meta зависят от сторонних провайдеров типа Anthropic, за услуги которых надо платить по коммерческим ставкам.

Microsoft начала предлагать стремящимся к оптимизации затрат на ИИ клиентам новую услугу, позволяющую оптимальным образом выбирать используемые средства. Если для решения поставленной задачи достаточно ограничиться применением более дешёвой модели, то она поручается именно ей, а не отправляется по наиболее дорогому для клиента маршруту. Иногда при ручной маршрутизации запросов компании предпочитают использовать более старые и дешёвые ИИ-модели, не гонясь за самыми прогрессивными. При всём этом внутри компаний всегда находятся пользователи, которым не хватает вычислительных ресурсов для решения своих задач. Публичным компаниям становится сложнее оправдывать растущие расходы на ИИ перед акционерами и инвесторами.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Студия создателя Deus Ex и System Shock перестанет делать игры — после провала Thick as Thieves в OtherSide осталось меньше десяти человек 8 мин.
Google не смогла отбиться от рекордного штрафа в €4,1 млрд в Европе 16 мин.
Кризис Xbox поставил под угрозу закрытия Obsidian — студию в ответе за Fallout: New Vegas, Pillars of Eternity и South Park: The Stick of Truth 59 мин.
Toyota собирается при помощи ИИ навести порядок в своей документации и терминологии 2 ч.
Некоторые смартфоны Google Pixel перестали издавать звуки, когда на них звонят 2 ч.
В сервисе Apple Hide My Email обнаружена уязвимость, позволяющая раскрыть настоящий адрес почты 2 ч.
Anthropic удалила из Claude скрытую защиту от дистилляции ИИ-моделей китайскими разработчиками 3 ч.
Представлено решение Curator.Scanner для поиска уязвимостей во внешней IT-инфраструктуре 4 ч.
Власти США предложили разработчикам ИИ создать единые стандарты для моделей 4 ч.
Министерство юстиции Бразилии рассекретило продолжение легендарной серии Nintendo 5 ч.
Amazon запустила достаточно спутников для запуска конкурента Starlink 19 мин.
ИИ подрывает экологические цели: выбросы углекислого газа у Amazon подскочили на 16 % в 2025 году 22 мин.
«Яндекс» разрабатывает новые ИИ-устройства — «Пин», «Хронум» и другие загадочные продукты 28 мин.
Инвестиции с кешбэком: NVIDIA вкладывается в создание ИИ-инфраструктуры партнёров в обмен на доход от её эксплуатации 2 ч.
Weave представила бытового робота Isaac 1 — он будет наводить порядок, пока хозяев нету дома 2 ч.
Будущая Xbox Project Helix, вероятно, будет лишена дисковода 2 ч.
В центре Москвы открыли новый флагманский магазин Xiaomi Store 2 ч.
Getty Images отказалась поглощать Shutterstock — помешал британский регулятор 2 ч.
Intel без лишнего шума подняла рекомендованные цены Core Ultra 7 270K Plus и Core Ultra 5 250K Plus 2 ч.
Microsoft сняла с производства бюджетные Surface Go и Surface Laptop Go — вместо них предлагает Dell XPS 13 2 ч.