The AI tokenmaxxing party is crashing over spiraling costs — leaked consulting firm audio suggests no one is sure how to measure AI effectiveness

Епоха токенмаксингу штучного інтелекту може бути дійсно закінчилась. Разом із історіями про те, як Amazon зменшує свій AI-рейтинговий топ, а також про те, як невідома компанія «викинула» через місяць токени на 500 мільйонів доларів, у витоку з аудіозапису консалтингової фірми Accenture з’являються свідчення про те, що ніхто не впевнений, як вимірювати ефективність AI, і як стримати розпилення токенів у клієнтських компаніях, повідомляє 404Media.

У витоку аудіо Accenture визнає, що певні тривіальні завдання, які передаються на ІІ, призводять до величезного перевитрачання токенів, особливо коли в процесі використовується агентний AI. Співробітники на зустрічі чітко усвідомлюють, що витрати на AI не лише зростають у компаніях, які активно впроваджують технологію, але й що майже немає способу передбачити, скільки коштуватиме конкретне завдання або чи є реальна цінність у використанні AI для його виконання.

Accenture раніше був надзвичайно оптимістичний щодо AI, навіть заохочуючи працівників користуватися ним настільки часто, що якщо вони цього не робили, ризикували просісти на підвищення. Але це виглядає як політика, яка може потрапити в історію AI, оскільки Accenture тепер явно усвідомлює, що витрачається надмірно на AI, і багато його клієнтів також.

Звід звід “tokenmaxxing” до “token hoarding” (накопичення токенів)

Більшість минулого року багато компаній рішуче рушили в AI-залежну бізнес-стратегію. Amazon мав AI-лідувальну таблицю, а генеральний директор Nvidia, Дженсен Хуанг, казав, що його «будуть лякати», якщо інженери не витрачатимуть щонайменше 50% їхньої річної заробітної плати на токени AI. За анекдотами, я знаю кількох розробників ПЗ і інженерів з даних, яких заохочували користуватися AI настільки, наскільки можливо. У них є ліміти на токени, але їх заохочували використати їх усі та знаходити нові способи це робити.

Це призводить до неконтрольованого витрачання токенів, якого Accenture бачить у даних клієнтів. Лідер стратегії агентного AI в Accenture, Justive Kwak, був процитований у витоку так: «Теперішнє зростання витрат на AI токени — швидке зростання […] коли компанії починають масштабувати AI, переходячи від простих чат-ботів до використання з агентними робочими процесами та автоматизацією, а потім до впровадження цих інструментів по всій корпорації, як Copilot, Claude Code та Codex.»

Це не є проблемою, яку вдасться обмежити лише кільком фірмам, додав він. «Це дійсно не нішова проблема. Вона стане проблемою кожної корпорації, якщо вони оптимістично ставляться до AI, якщо ще не зробили цього,» сказав він, додаючи, що витрати на токени зростають «експоненційно, з кожним, хто починає користуватися AI».

Проте це може почати змінюватися. Amazon скасував свій AI-рейтинговий топ — чутки стверджують, що це та сама таємнича компанія з витратами на AI понад півмільярда доларів за один місяць — Uber обмежує використання AI, щоб зменшити витрати, а Axios у кінці травня повідомляли, що ряд CEO та компаній переходять на більш доступні моделі та більш ретельно контролюють використання співробітниками.

Деякі розробники, яких я знаю, використовують «трюк печерного людини» для зменшення витрат токенів. Сам CEO OpenAI Сэм Альтман заявив, що відчуває, що витрати на токени AI стають серйозною проблемою для людей.

Усе це відбувається на тлі переходу багатьох основних постачальників AI на оплату за токени. Раніше підписки пропонували дуже вигідні ставки за використання AI, а раптом компанії повинні платити за введені токени та за вихідні токени AI — навіть коли вони були розлогими, робили помилки або вимагали подальших виправлень.

Як показує дзвінок Accenture, це змушує навіть деякі з найбільш оптимістичних щодо AI організації ставити під сумнів використання, бо вимірювання витрат і прибутку від цих інвестицій виявляється майже неможливим.

Як сказав Kwak у витоку аудіо: «Керівництво, особливо на рівнях CFO, COO та CIO, усе ще ставить питання, чи отримують вони цінність від наших витрат на AI.»

Як вимірювати повернення інвестицій?

Хоча великі мовні моделі виявляються надзвичайно корисними у вузьких випадках, їхня ефективність у ширшому спектрі завдань більш розмита. Особливо коли мова йде про фінансування. Коли менеджери та керівники дивляться на бюджетування AI та повернення інвестицій, важко звести цифри разом.

Коли ви не можете знати, скільки токенів знадобиться для виконання завдання, або чи буде завдання виконане ефективно з першої, другої чи третьої спроби; коли ви не можете повністю контролювати довжину виходу або знати, чи вихід буде помилковим, або неправдивим, або просто випадковою галюцинацією — як вимірювати повернення інвестицій у цей інструмент?

«Ми стикаємося з переломним моментом, коли AI стає суттєвою частиною витратної структури; витрати стають дуже непередбачуваними», — сказав Kwak під час зустрічі. Хоча загальний рахунок за витрати на AI видимий, він припустив, визначити конкретну цінність, пов’язану з цією витратою токенів, неможливо.

Здається, це створило культуру ієрархії завдань у Accenture, де деякі завдання вважаються більш придатними для використання токенів AI, ніж інші. Коли Kwak підготувався показати слайди під час зустрічі, керівник клієнтської групи Accenture Стюері Хендерсон пожартував, що сподівається, що Kwak не використовуватиме AI для перетворення PDF у зображення, а потім у Markdown-файли.

«Я з’ясував, що це один із великих «поглиначів токенів», — сказав він. «Перетворення PDF на Markdown: чи це правильно?»

Kwak погодився, що дані Accenture дійсно показують, що деякі завдання виконуються за допомогою AI, чого насправді не потребує, і витрачають зайві токени через це. Багатьма з цих проблем, за його словами, заволодівають нестехнічні працівники, які надмірно їх використовують.

«Ми бачимо з деяких даних всередині компанії, що не наші інженери керують витратами на токени. Багато з нестехнічних працівників виконують ці дії.»

Зараз, коли Accenture заохочує активне впровадження AI серед своїх клієнтів, він опинився у дивній позиції: потрібно заохочувати обмеження або щонайменше стимулювати більш обдумане використання токенів. Тепер він бачить наступну можливість — допомогти клієнтам з роздумами про «економіку токенів».

Розробляють інструмент під назвою «Token IQ», який допоможе консультувати клієнтів, згідно з витоком, але поки що ніяких оголошень не робили.

Що з цього випливає: витік Accenture та дії деяких великих технічних компаній показують, що фінанси масового впровадження AI на рівні токенів не узгоджуються. Без чіткого способу виміряти повернення інвестицій у AI, ми можемо побачити, що навіть ті компанії з найвищим рівнем використання токенів обмежуватимуть доступ та витрати протягом решти 2026 року, коли вони переглядатимуть стратегію AI.

June 25, 2026 at 05:35PM

The AI tokenmaxxing party is crashing over spiraling costs — leaked consulting firm audio suggests no one is sure how to measure AI effectiveness

Коментарі

Залишити відповідь Скасувати коментар