Огляд ЗМІ

ШІ-моделі починають розв’язувати складні математичні задачі, чим дивують навіть видатних вчених світу

16 січня 2026, 09:34Новини148

Этот материал также доступен на русском

Задачі Ердеша — набір із понад 1000 гіпотез угорського математика, які опубліковані у відкритому доступі

  • Посилання скопійованоlink copied

На вихідних Ніл Сомані, інженер-програміст і колишній дослідник квантової математики, вирішив перевірити, на що здатна нова модель від OpenAI у математиці. Результат виявився неочікуваним: він завантажив задачу в чат і дав ШІ 15 хвилин на роздуми. Отримане рішення Ніл перевірив за допомогою інструменту Harmonic — доведення було бездоганним і пройшло формальну перевірку.

«Мені було цікаво визначити базовий рівень: з якими складними математичними задачами великі мовні моделі вже справляються, а які їм все ще не під силу», — зазначив Сомані. Сюрпризом стало те, що з використанням останньої моделі межа можливостей ШІ почала дещо зміщуватися вперед.

«Ланцюжок міркувань» ChatGPT вражає ще більше: він впевнено оперує такими математичними аксіомами, як формула Лежандра, постулат Бертрана й теорема «Зірки Давида», пише TechCrunch.

У процесі модель натрапила на публікацію 2013 року на Math Overflow, де гарвардський професор Ноам Елкіс розв’язував подібну проблему. Але доведення, яке видав ChatGPT, не було простим копіюванням — воно принципово відрізнялося від варіанта Елкіса. Ба більше, ШІ надав вичерпну відповідь на версію задачі від легендарного Пала Ердеша, чия величезна колекція невирішених задач стала справжнім полігоном для випробування ШІ.

Цей успіх — справжній виклик для скептиків, які не вірять у можливості ШІ, і такі випадки стають дедалі частішими. Штучний інтелект сьогодні всюди в математиці: чи то спеціалізована модель Aristotle для формальних доведень, чи Deep Research для пошуку наукових праць. Проте саме з виходом GPT 5.2 — яку Сомані називає відчутно розумнішою за попередні версії — обсяг розв’язаних ШІ проблем став настільки великим, що його неможливо не помічати. Це ставить нові питання про здатність LLM розширювати межі людських знань.

Сомані аналізував задачі Ердеша — набір із понад 1000 гіпотез угорського математика, які опубліковані у відкритому доступі. Ці задачі, що суттєво різняться за тематикою та складністю, стали спокусливою ціллю для ШІ-математики. Хоча перший успіх у листопаді продемонструвала модель AlphaEvolve від Google Gemini, останнім часом Сомані та його колеги виявили, що GPT 5.2 демонструє надзвичайну вправність у розв’язанні математичних задач високого рівня.

З Різдва статус 15 задач на сайті Ердеша було змінено з «відкритих» на «розв’язані» — і в 11 випадках у примітках до розв’язків було прямо вказано, що у процесі використовувалися моделі штучного інтелекту.

Відомий математик Теренс Тао наводить більш стриману статистику на GitHub. Він виділяє вісім прикладів, де ШІ самостійно просунувся у вирішенні задач Ердеша, і ще шість — де нейромережі допомогли, відшукавши та доопрацювавши старі наукові праці. До моменту, коли штучний інтелект зможе займатися математикою зовсім без допомоги людей, ще далеко, проте роль великих моделей у цій галузі стає дедалі вагомішою.

На Mastodon Тао припустив, що масштабованість систем ШІ робить їх «краще пристосованими для систематичного застосування до «довгого хвоста» маловідомих задач Ердеша, багато з яких насправді мають прості розв’язання.

«Так, багато з цих простіших задач Ердеша тепер із більшою ймовірністю можна вирішити виключно методами на основі штучного інтелекту, ніж людськими чи гібридними засобами», — зазначив Тао.

Ще однією рушійною силою є нещодавній перехід до формалізації — трудомісткого процесу, який полегшує перевірку та розвиток математичних міркувань. Формалізація не обов’язково потребує використання ШІ чи навіть комп’ютерів, проте поява нових автоматизованих інструментів значно спростила це завдання. Відкритий «асистент доведень» Lean, розроблений у Microsoft Research у 2013 році, став широко вживаним у цій галузі як засіб формалізації доведень, а ШІ-інструменти, як-от Aristotle від Harmonic, обіцяють автоматизувати значну частину цієї роботи.

Для засновника Harmonic Тюдора Ачіма раптовий сплеск кількості розв’язаних задач Ердеша важить менше, ніж той факт, що найвидатніші математики світу починають серйозно ставитися до цих інструментів. «Мене більше хвилює те, що професори математики та комп’ютерних наук використовують [ШІ-інструменти]», — сказав Ачім. «Ці люди дбають про свою репутацію, тому коли вони заявляють, що користуються Aristotle або ChatGPT, це і є справжнім доказом».

Проблемні борги
17 червня 2026, 15:15 • Новини • Проблемні борги
Проекти та інновації
16 червня 2026, 15:35 • Новини • Проекти та інновації

Не пропустіть важливе!
Підписуйтесь та отримуйте дайжест новин

Щоденно чи щотижня – обираєте ви!

Матеріали за темою

Огляд ринків

Статті • БОРГ-review
У крипті є одне жорстке правило: ви самі собі банк і служба безпеки. Усе, що потрапило в мережу, залишається там назавжди

Огляд ринків

Статті • БОРГ-review
Воєнний стан приніс не лише руйнування інфраструктури та переміщення людей. Він докорінно змінив саму природу підприємницького ризику

Огляд ринків

Статті • БОРГ-review
Найдорожча помилка боржника - сприймати лист ТПП від 28.02.2022 чи окремий сертифікат як готове рішення на свою користь

Огляд ринків

Статті • БОРГ-review
Новим фронтендом для сучасної людини стають криптовалютні платформи

Огляд ринків

Статті • БОРГ-review
Якщо хакери використовують AI для обману, гаманці та біржі роблять це для захисту

Огляд ринків

Статті • БОРГ-review
Якщо недійсність правочину встановлена законом, то визнання його судом недійсним не вимагається