ШІ-моделі починають розв’язувати складні математичні задачі, чим дивують навіть видатних вчених світу
Этот материал также доступен на русском
Задачі Ердеша — набір із понад 1000 гіпотез угорського математика, які опубліковані у відкритому доступі
На вихідних Ніл Сомані, інженер-програміст і колишній дослідник квантової математики, вирішив перевірити, на що здатна нова модель від OpenAI у математиці. Результат виявився неочікуваним: він завантажив задачу в чат і дав ШІ 15 хвилин на роздуми. Отримане рішення Ніл перевірив за допомогою інструменту Harmonic — доведення було бездоганним і пройшло формальну перевірку.
«Мені було цікаво визначити базовий рівень: з якими складними математичними задачами великі мовні моделі вже справляються, а які їм все ще не під силу», — зазначив Сомані. Сюрпризом стало те, що з використанням останньої моделі межа можливостей ШІ почала дещо зміщуватися вперед.
«Ланцюжок міркувань» ChatGPT вражає ще більше: він впевнено оперує такими математичними аксіомами, як формула Лежандра, постулат Бертрана й теорема «Зірки Давида», пише TechCrunch.
У процесі модель натрапила на публікацію 2013 року на Math Overflow, де гарвардський професор Ноам Елкіс розв’язував подібну проблему. Але доведення, яке видав ChatGPT, не було простим копіюванням — воно принципово відрізнялося від варіанта Елкіса. Ба більше, ШІ надав вичерпну відповідь на версію задачі від легендарного Пала Ердеша, чия величезна колекція невирішених задач стала справжнім полігоном для випробування ШІ.
Цей успіх — справжній виклик для скептиків, які не вірять у можливості ШІ, і такі випадки стають дедалі частішими. Штучний інтелект сьогодні всюди в математиці: чи то спеціалізована модель Aristotle для формальних доведень, чи Deep Research для пошуку наукових праць. Проте саме з виходом GPT 5.2 — яку Сомані називає відчутно розумнішою за попередні версії — обсяг розв’язаних ШІ проблем став настільки великим, що його неможливо не помічати. Це ставить нові питання про здатність LLM розширювати межі людських знань.
Сомані аналізував задачі Ердеша — набір із понад 1000 гіпотез угорського математика, які опубліковані у відкритому доступі. Ці задачі, що суттєво різняться за тематикою та складністю, стали спокусливою ціллю для ШІ-математики. Хоча перший успіх у листопаді продемонструвала модель AlphaEvolve від Google Gemini, останнім часом Сомані та його колеги виявили, що GPT 5.2 демонструє надзвичайну вправність у розв’язанні математичних задач високого рівня.
З Різдва статус 15 задач на сайті Ердеша було змінено з «відкритих» на «розв’язані» — і в 11 випадках у примітках до розв’язків було прямо вказано, що у процесі використовувалися моделі штучного інтелекту.
Відомий математик Теренс Тао наводить більш стриману статистику на GitHub. Він виділяє вісім прикладів, де ШІ самостійно просунувся у вирішенні задач Ердеша, і ще шість — де нейромережі допомогли, відшукавши та доопрацювавши старі наукові праці. До моменту, коли штучний інтелект зможе займатися математикою зовсім без допомоги людей, ще далеко, проте роль великих моделей у цій галузі стає дедалі вагомішою.
На Mastodon Тао припустив, що масштабованість систем ШІ робить їх «краще пристосованими для систематичного застосування до «довгого хвоста» маловідомих задач Ердеша, багато з яких насправді мають прості розв’язання.
«Так, багато з цих простіших задач Ердеша тепер із більшою ймовірністю можна вирішити виключно методами на основі штучного інтелекту, ніж людськими чи гібридними засобами», — зазначив Тао.
Ще однією рушійною силою є нещодавній перехід до формалізації — трудомісткого процесу, який полегшує перевірку та розвиток математичних міркувань. Формалізація не обов’язково потребує використання ШІ чи навіть комп’ютерів, проте поява нових автоматизованих інструментів значно спростила це завдання. Відкритий «асистент доведень» Lean, розроблений у Microsoft Research у 2013 році, став широко вживаним у цій галузі як засіб формалізації доведень, а ШІ-інструменти, як-от Aristotle від Harmonic, обіцяють автоматизувати значну частину цієї роботи.
Для засновника Harmonic Тюдора Ачіма раптовий сплеск кількості розв’язаних задач Ердеша важить менше, ніж той факт, що найвидатніші математики світу починають серйозно ставитися до цих інструментів. «Мене більше хвилює те, що професори математики та комп’ютерних наук використовують [ШІ-інструменти]», — сказав Ачім. «Ці люди дбають про свою репутацію, тому коли вони заявляють, що користуються Aristotle або ChatGPT, це і є справжнім доказом».






-
Огляд ЗМІНа Закарпатті АРМА почала перевірку результатів продажу землі на БоржавіСьогодні, 11:00 • Новини • Огляд ЗМІ -
Огляд ЗМІЗарплати військових: як розподіляються додаткові виплати 30, 50 та 100 тисячСьогодні, 10:49 • Новини • Огляд ЗМІ -
Огляд ЗМІУкраїнський дрон Raybird на водневому паливі почали використовувати на фронтіСьогодні, 10:36 • Новини • Огляд ЗМІ -
Огляд ЗМІІмпортозаміщення провалилося: 70% російських компаній не змогли замінити західний софтСьогодні, 10:23 • Новини • Огляд ЗМІ -
Огляд ЗМІКуди дзвонити у разі відсутності тепла, води та світлаСьогодні, 10:12 • Новини • Огляд ЗМІ -
Огляд ЗМІБлокування експорту України спричинило різке подорожчання російської соняшникової оліїСьогодні, 10:00 • Новини • Огляд ЗМІ -
Огляд ЗМІНМТ у 2026 році: затверджено дати іспитів та обов’язкові предметиСьогодні, 09:47 • Новини • Огляд ЗМІ -
МЗС України закликає до санкцій проти тіньового зернового флоту Росії
Сьогодні, 09:27 • Новини -
Огляд ЗМІMicrosoft і Meta платитимуть «Вікіпедії» за навчання ШІ на її контентіСьогодні, 09:22 • Новини • Огляд ЗМІ -
Огляд ЗМІГороскоп на 16 січня для всіх знаків зодіаку: день, коли добро буде винагороджено по заслугахСьогодні, 09:11 • Новини • Огляд ЗМІ -
Огляд ЗМІСкільки коштує один куб дров у січні 2026 рСьогодні, 09:00 • Новини • Огляд ЗМІ -
В Україні запроваджуються опорні пункти незламності, що працюватимуть цілодобово, — Олексій Кулеба
Вчора, 18:00 • Новини -
Мінфін провів аукціон з обміну ОВДП на ₴17,36 мільярда
Вчора, 17:49 • Новини -
За кордономМалаві розраховує завершити переговори про реструктуризацію державного боргу до лютого 2026 рокуВчора, 17:38 • Новини • За кордоном -
Ціни на хліб, крупи та овочі зростатимуть у 2026 році – експерт
Вчора, 17:27 • Новини -
Естонська група Iute Group викупила РВС Банк: Фонд гарантування продав 100% акцій
Вчора, 17:17 • Новини -
Проблемні боргиКолізії та конфліктиСуд звільнив Чернігів від мільярдного боргу: «Теплокомуненерго» не платитиме за зобов’язання «Технови»Вчора, 17:07 • Новини • Проблемні борги -
Проблемні боргиТехнічний дефолт «Укрзалізниці»: що означає призупинення виплат за євробондами та які ризики попередуВчора, 16:57 • Новини • Проблемні борги -
Переробна промисловість і торгівля забезпечили понад третину податкових надходжень бюджету минулого року
Вчора, 16:46 • Новини -
На Київщині затримали банду, яка вимагала у фермерки $130 тисяч вигаданого боргу
Вчора, 16:36 • Новини -
За підсумками 2025 року надходження від приватизації склали близько 6,3 млрд грн
Вчора, 16:26 • Новини -
Euro NCAP назвав найбезпечніші автомобілі 2025 року
Вчора, 16:16 • Новини
Матеріали за темою

Огляд ринків

Огляд ринків

Огляд ринків

Огляд ринків

Огляд ринків








