ШІ-моделі починають розв’язувати складні математичні задачі, чим дивують навіть видатних вчених світу

16 січня 2026, 09:34•Новини•

148

Этот материал также доступен на русском

Задачі Ердеша — набір із понад 1000 гіпотез угорського математика, які опубліковані у відкритому доступі

На вихідних Ніл Сомані, інженер-програміст і колишній дослідник квантової математики, вирішив перевірити, на що здатна нова модель від OpenAI у математиці. Результат виявився неочікуваним: він завантажив задачу в чат і дав ШІ 15 хвилин на роздуми. Отримане рішення Ніл перевірив за допомогою інструменту Harmonic — доведення було бездоганним і пройшло формальну перевірку.

«Мені було цікаво визначити базовий рівень: з якими складними математичними задачами великі мовні моделі вже справляються, а які їм все ще не під силу», — зазначив Сомані. Сюрпризом стало те, що з використанням останньої моделі межа можливостей ШІ почала дещо зміщуватися вперед.

«Ланцюжок міркувань» ChatGPT вражає ще більше: він впевнено оперує такими математичними аксіомами, як формула Лежандра, постулат Бертрана й теорема «Зірки Давида», пише TechCrunch.

У процесі модель натрапила на публікацію 2013 року на Math Overflow, де гарвардський професор Ноам Елкіс розв’язував подібну проблему. Але доведення, яке видав ChatGPT, не було простим копіюванням — воно принципово відрізнялося від варіанта Елкіса. Ба більше, ШІ надав вичерпну відповідь на версію задачі від легендарного Пала Ердеша, чия величезна колекція невирішених задач стала справжнім полігоном для випробування ШІ.

Цей успіх — справжній виклик для скептиків, які не вірять у можливості ШІ, і такі випадки стають дедалі частішими. Штучний інтелект сьогодні всюди в математиці: чи то спеціалізована модель Aristotle для формальних доведень, чи Deep Research для пошуку наукових праць. Проте саме з виходом GPT 5.2 — яку Сомані називає відчутно розумнішою за попередні версії — обсяг розв’язаних ШІ проблем став настільки великим, що його неможливо не помічати. Це ставить нові питання про здатність LLM розширювати межі людських знань.

Сомані аналізував задачі Ердеша — набір із понад 1000 гіпотез угорського математика, які опубліковані у відкритому доступі. Ці задачі, що суттєво різняться за тематикою та складністю, стали спокусливою ціллю для ШІ-математики. Хоча перший успіх у листопаді продемонструвала модель AlphaEvolve від Google Gemini, останнім часом Сомані та його колеги виявили, що GPT 5.2 демонструє надзвичайну вправність у розв’язанні математичних задач високого рівня.

З Різдва статус 15 задач на сайті Ердеша було змінено з «відкритих» на «розв’язані» — і в 11 випадках у примітках до розв’язків було прямо вказано, що у процесі використовувалися моделі штучного інтелекту.

Відомий математик Теренс Тао наводить більш стриману статистику на GitHub. Він виділяє вісім прикладів, де ШІ самостійно просунувся у вирішенні задач Ердеша, і ще шість — де нейромережі допомогли, відшукавши та доопрацювавши старі наукові праці. До моменту, коли штучний інтелект зможе займатися математикою зовсім без допомоги людей, ще далеко, проте роль великих моделей у цій галузі стає дедалі вагомішою.

На Mastodon Тао припустив, що масштабованість систем ШІ робить їх «краще пристосованими для систематичного застосування до «довгого хвоста» маловідомих задач Ердеша, багато з яких насправді мають прості розв’язання.

«Так, багато з цих простіших задач Ердеша тепер із більшою ймовірністю можна вирішити виключно методами на основі штучного інтелекту, ніж людськими чи гібридними засобами», — зазначив Тао.

Ще однією рушійною силою є нещодавній перехід до формалізації — трудомісткого процесу, який полегшує перевірку та розвиток математичних міркувань. Формалізація не обов’язково потребує використання ШІ чи навіть комп’ютерів, проте поява нових автоматизованих інструментів значно спростила це завдання. Відкритий «асистент доведень» Lean, розроблений у Microsoft Research у 2013 році, став широко вживаним у цій галузі як засіб формалізації доведень, а ШІ-інструменти, як-от Aristotle від Harmonic, обіцяють автоматизувати значну частину цієї роботи.

Для засновника Harmonic Тюдора Ачіма раптовий сплеск кількості розв’язаних задач Ердеша важить менше, ніж той факт, що найвидатніші математики світу починають серйозно ставитися до цих інструментів. «Мене більше хвилює те, що професори математики та комп’ютерних наук використовують [ШІ-інструменти]», — сказав Ачім. «Ці люди дбають про свою репутацію, тому коли вони заявляють, що користуються Aristotle або ChatGPT, це і є справжнім доказом».