Обзор СМИ

ШИ-модели начинают решать сложные математические задачи, чем удивляют даже выдающихся ученых мира

16 января 2026, 09:34Новости60

Цей матеріал також доступний українською

Задачи Эрдеша — набор из более чем 1000 гипотез венгерского математика, опубликованных в открытом доступе

  • Ссылка скопированаlink copied

В выходные Нил Сомани, инженер-программист и бывший исследователь квантовой математики, решил проверить, на что способна новая модель от OpenAI в математике. Результат оказался неожиданным: он скачал задачу в чат и дал ИИ 15 минут на размышления. Полученное решение Нил проверил с помощью инструмента Harmonic – доказательство было безупречным и прошло формальную проверку.

“Мне было интересно определить базовый уровень: с какими сложными математическими задачами большие языковые модели уже справляются, а какие им все еще не под силу”, – отметил Сомани. Сюрпризом стало то, что с использованием последней модели предел возможностей ИИ начал несколько смещаться вперед.

«Цепочка рассуждений» ChatGPT поражает еще больше: она уверенно оперирует такими математическими аксиомами, как формула Лежандра, постулат Бертрана и теорема «Звезды Давида», пишет TechCrunch.

В процессе модель натолкнулась на публикацию 2013 года на Math Overflow, где гарвардский профессор Ноам Элкис решал подобную проблему. Но доказательство, выданное ChatGPT, не было простым копированием — оно принципиально отличалось от варианта Элкиса. Более того, ИИ предоставил исчерпывающий ответ на версию задачи от легендарного Пала Эрдеша, чья огромная коллекция нерешенных задач стала настоящим полигоном для испытания ИИ.

Этот успех – настоящий вызов для скептиков, которые не верят в возможности ИИ, и такие случаи становятся все чаще. Искусственный интеллект сегодня повсюду в математике: то ли специализированная модель Aristotle для формальных доказательств, то ли Deep Research для поиска научных работ. Однако именно с выходом GPT 5.2 – которую Сомани называет ощутимо умнее предыдущих версий – объем решенных ИИ проблем стал настолько большим, что его невозможно не замечать. Это ставит новые вопросы о способности LLM расширять пределы человеческих знаний.

Сомани анализировал задачи Эрдеша — набор из более чем 1000 гипотез венгерского математика, опубликованных в открытом доступе. Эти задачи, существенно отличающиеся по тематике и сложности, стали соблазнительной целью для ИИ-математики. Хотя первый успех в ноябре продемонстрировала модель AlphaEvolve от Google Gemini, в последнее время Сомани и его коллеги обнаружили, что GPT 5.2 демонстрирует чрезвычайную сноровку в решении математических задач высокого уровня.

С Рождества статус 15 задач на сайте Эрдеша был изменен с «открытых» на «решенные» — и в 11 случаях в примечаниях к решениям было прямо указано, что в процессе использовались модели искусственного интеллекта.

Известный математик Теренс Тао приводит более сдержанную статистику на GitHub. Он выделяет восемь примеров, где ИИ самостоятельно продвинулся в решении задач Эрдеша, и еще шесть — где нейросети помогли, отыскав и доработав старые научные труды. К моменту, когда искусственный интеллект сможет заниматься математикой совсем без помощи людей, еще далеко, однако роль больших моделей в этой области становится все более весомой.

На Mastodon Тао предположил, что масштабируемость систем ИИ делает их «лучше приспособленными для систематического применения к «длинному хвосту» малоизвестных задач Эрдеша, многие из которых на самом деле имеют простые решения.

«Да, многие из простейших задач Эрдеша теперь с большей вероятностью можно решить исключительно методами на основе искусственного интеллекта, чем человеческими или гибридными средствами», — отметил Тао.

Еще одной движущей силой является недавний переход к формализации — трудоемкого процесса, облегчающего проверку и развитие математических соображений. Формализация необязательно требует использования ИИ или даже компьютеров, однако появление новых автоматизированных инструментов значительно упростило эту задачу. Открытый «ассистент доказательств» Lean, разработанный в Microsoft Research в 2013 году, стал широко применяемым в этой области как средство формализации доказательств, а ШИ-инструменты, как Aristotle от Harmonic, обещают автоматизировать значительную часть этой работы.

Для основателя Harmonic Тюдора Ачима внезапный всплеск количества решенных задач Эрдеша весит меньше, чем тот факт, что самые выдающиеся математики мира начинают серьезно относиться к этим инструментам. «Меня больше волнует то, что профессора математики и компьютерных наук используют [ИИ-инструменты]», — сказал Ачим. «Эти люди заботятся о своей репутации, поэтому когда они заявляют, что пользуются Aristotle или ChatGPT, это и есть подлинное доказательство».

Не пропустите важное!
Подписывайтесь и получайте дайжест новостей

Ежедневно или еженедельно – выбираете вы!

Мнение эксперта

Хотите стать автором borg.expert?

Материалы по теме

Огляд ринків

Статьи • БОРГ-review
Ключові помилки під час укладення угоди, які призводять до судів і втрати коштів

Огляд ринків

Статьи • БОРГ-review
Про роль ОПЕК+, «премію за страх» і чому дешевшого пального швидко не буде

Огляд ринків

Статьи • БОРГ-review
Проблема вибору «правильного» коду виду цільового призначення земель для ОРСГП лежить на стику земельного та містобудівного регулювання

Огляд ринків

Статьи • БОРГ-review
Суди все частіше оцінюють не форму правочину, а його реальний економічний зміст

Огляд ринків

Статьи • БОРГ-review
Верховний Суд зазначив, що під час формування земельної ділянки визначення її виду цільового призначення здійснюється розробником документації із землеустрою

Огляд ринків

Статьи • БОРГ-review
Як змінилися правила публічних закупівель під час війни, чому зросли ризики формальної конкуренції і що насправді заважає бізнесу працювати на рівних умовах