Pokémon став новим випробуванням для ШІ: класична гра з 1990-х перетворилася на бенчмарк для провідних моделей

Сьогодні, 13:09Новини94

Этот материал также доступен на русском

Google навіть включив прогрес моделі Gemini у Pokémon до свого офіційного звіту, а компанія Anthropic регулярно демонструє, як Claude справляється з грою

  • Посилання скопійованоlink copied

Класична відеогра Pokémon несподівано стала одним із ключових інструментів тестування передових моделей штучного інтелекту. Стартапи та великі технологічні компанії дедалі частіше використовують піксельну гру з 1990-х років для оцінки реального прогресу ШІ.

На відміну від традиційних інтелектуальних ігор — шахів, го чи покеру — Pokémon вимагає від моделі не миттєвої реакції, а довготривалого планування, орієнтації у складному просторі, послідовного прийняття рішень і здатності утримувати контекст протягом годин або навіть днів ігрового процесу.

Під час таких тестів ШІ має самостійно досліджувати ігровий світ, проходити лабіринти, ловити покемонів і розв’язувати задачі, результат яких не видно одразу. У подібних експериментах уже беруть участь моделі Claude, GPT, Gemini та інші. Трансляції їхньої «гри» на платформі Twitch збирають сотні тисяч коментарів, а сам процес активно обговорюється у спільноті розробників.

Google навіть включив прогрес моделі Gemini у Pokémon до свого офіційного звіту, а компанія Anthropic регулярно демонструє, як Claude справляється з грою, під час профільних конференцій і публічних заходів.

Розробники пояснюють, що практична цінність Pokémon полягає саме у комплексності завдань. Гра дозволяє оцінити не здатність ШІ відповідати на окремі запити, а його вміння мислити стратегічно, планувати наперед і діяти в мінливому середовищі — тобто ті якості, які вважаються критично важливими для наступного покоління інтелектуальних систем.

Як зазначає The Wall Street Journal, для індустрії Pokémon поступово перетворюється на новий «бенчмарк дорослішання» штучного інтелекту, що показує, наскільки далеко ШІ просунувся від простих відповідей до складної поведінки у реальному часі.

Не пропустіть важливе!
Підписуйтесь та отримуйте дайжест новин

Щоденно чи щотижня – обираєте ви!

Думка експерта

Бажаєте стати автором borg.expert?

Матеріали за темою

Огляд ринків

Статті • БОРГ-review
Понад 99% активів на ринку становлять саме токени. Станом на 2025 рік їхня кількість оцінюється в ~36 млн, тоді як криптовалют – близько десяти тисяч

Огляд ринків

Статті • БОРГ-review
Блокчейн дозволяє людям діяти навіть там, де держава намагається закрити всі можливості, фактично виступаючи проти диктатури і цензури в будь-якій формі

Огляд ринків

Статті • БОРГ-review
Не хочеться думати, що до розробки законів в Україні іноді долучаються випадкові люди

Огляд ринків

Статті • БОРГ-review
Проблема в тому, що "спір про право" інколи перетворюється на штучний бар’єр для доступу до процедур банкрутства

Огляд ринків

Статті • БОРГ-review
Санкційні активи можуть стати драйвером оновлення економіки, але лише тоді, коли держава гарантує інвесторам правову стабільність

Огляд ринків

Статті • БОРГ-review
Для ефективного використання можливостей, наданих Законом №4564-ІХ, суб’єктам господарювання рекомендується ретельно переглянути статути своїх товариств