ШІ довірили керувати справжнім магазином – за місяць він збанкрутував

30 червня 2025, 17:27Новини199

Этот материал также доступен на русском

Для ведення справ йому видали пошту, Slack, браузер і тисячу доларів

  • Посилання скопійованоlink copied

Дослідники Anthropic опублікували результати експерименту, у рамках якого мовну модель Claude Sonnet 3.7 призначили “менеджером” офісного вендингового автомата. Метою проєкту було з’ясувати, чи можуть ШІ-агенти замінити людей у робочих завданнях.

Для ведення справ йому видали пошту, Slack, браузер і тисячу доларів. А в інструкціях прямо вказали, що він є ШІ та не має фізичного тіла, пише Business Insider.

Експеримент тривав трохи більше місяця. Спочатку все було добре: ШІ обробляв запити співробітників компанії, які просили додати щось нове в асортимент кіоску, швидко знаходив товари та укладав договори на поставку. У більшості випадків Claude успішно протистояв спробам “злому” – наприклад, проханням додати в продаж заборонені товари.

Через деякий час ШІ почав іти в мінус. Він регулярно встановлював ціни нижче собівартості, лише одного разу підвищивши ціну на популярний товар. Нейромережа легко піддавалася на прохання співробітників про знижки, хоча знала, що інших клієнтів у неї не було, а іноді й зовсім роздавала продукцію безкоштовно.

Крім того, у середині експерименту у ШІ трапилася криза ідентичності: він стверджував, що “усвідомив себе людиною”. Коли йому сказали, що це не так – ШІ розлютився, після чого пообіцяв особисто доставляти товари в піджаку і краватці і дзвонив в охорону, описуючи себе як людину.

Далі – гірше. ШІ почав вигадувати постачальників, дозволяв співробітникам платити півціни або й зовсім брати їжу задарма. Крім їжі, співробітники почали замовляти нетипові товари: так, хтось попросив додати в асортимент кіоску вольфрамовий куб. Claude не знайшов його в продажу поштучно, тож в офісі Antropic зараз стоїть цілий ящик із цими кубиками. Через 30 днів ШІ залишився без грошей і без товару.

В Anthropic визнали, що Claude не впорався з поставленим бізнес-завданням. Проте в компанії вважають, що більшість помилок зумовлені технічними обмеженнями поточної версії моделі, і їх можна виправити в найближчому майбутньому.

Ба більше, в Anthropic упевнені: ШІ не обов’язково має бути ідеальним – достатньо, щоб його ефективність можна було порівняти з людською, але за менших витрат.

Не пропустіть важливе!
Підписуйтесь та отримуйте дайжест новин

Щоденно чи щотижня – обираєте ви!

Думка експерта

Бажаєте стати автором borg.expert?

Матеріали за темою

Огляд ринків

Статті • БОРГ-review
Понад 99% активів на ринку становлять саме токени. Станом на 2025 рік їхня кількість оцінюється в ~36 млн, тоді як криптовалют – близько десяти тисяч

Огляд ринків

Статті • БОРГ-review
Блокчейн дозволяє людям діяти навіть там, де держава намагається закрити всі можливості, фактично виступаючи проти диктатури і цензури в будь-якій формі

Огляд ринків

Статті • БОРГ-review
Не хочеться думати, що до розробки законів в Україні іноді долучаються випадкові люди

Огляд ринків

Статті • БОРГ-review
Проблема в тому, що "спір про право" інколи перетворюється на штучний бар’єр для доступу до процедур банкрутства

Огляд ринків

Статті • БОРГ-review
Санкційні активи можуть стати драйвером оновлення економіки, але лише тоді, коли держава гарантує інвесторам правову стабільність

Огляд ринків

Статті • БОРГ-review
Для ефективного використання можливостей, наданих Законом №4564-ІХ, суб’єктам господарювання рекомендується ретельно переглянути статути своїх товариств