Обзор СМИ

ШИ-модели начинают решать сложные математические задачи, чем удивляют даже выдающихся ученых мира

Сегодня, 09:34Новости4

Цей матеріал також доступний українською

Задачи Эрдеша — набор из более чем 1000 гипотез венгерского математика, опубликованных в открытом доступе

  • Ссылка скопированаlink copied

В выходные Нил Сомани, инженер-программист и бывший исследователь квантовой математики, решил проверить, на что способна новая модель от OpenAI в математике. Результат оказался неожиданным: он скачал задачу в чат и дал ИИ 15 минут на размышления. Полученное решение Нил проверил с помощью инструмента Harmonic – доказательство было безупречным и прошло формальную проверку.

“Мне было интересно определить базовый уровень: с какими сложными математическими задачами большие языковые модели уже справляются, а какие им все еще не под силу”, – отметил Сомани. Сюрпризом стало то, что с использованием последней модели предел возможностей ИИ начал несколько смещаться вперед.

«Цепочка рассуждений» ChatGPT поражает еще больше: она уверенно оперирует такими математическими аксиомами, как формула Лежандра, постулат Бертрана и теорема «Звезды Давида», пишет TechCrunch.

В процессе модель натолкнулась на публикацию 2013 года на Math Overflow, где гарвардский профессор Ноам Элкис решал подобную проблему. Но доказательство, выданное ChatGPT, не было простым копированием — оно принципиально отличалось от варианта Элкиса. Более того, ИИ предоставил исчерпывающий ответ на версию задачи от легендарного Пала Эрдеша, чья огромная коллекция нерешенных задач стала настоящим полигоном для испытания ИИ.

Этот успех – настоящий вызов для скептиков, которые не верят в возможности ИИ, и такие случаи становятся все чаще. Искусственный интеллект сегодня повсюду в математике: то ли специализированная модель Aristotle для формальных доказательств, то ли Deep Research для поиска научных работ. Однако именно с выходом GPT 5.2 – которую Сомани называет ощутимо умнее предыдущих версий – объем решенных ИИ проблем стал настолько большим, что его невозможно не замечать. Это ставит новые вопросы о способности LLM расширять пределы человеческих знаний.

Сомани анализировал задачи Эрдеша — набор из более чем 1000 гипотез венгерского математика, опубликованных в открытом доступе. Эти задачи, существенно отличающиеся по тематике и сложности, стали соблазнительной целью для ИИ-математики. Хотя первый успех в ноябре продемонстрировала модель AlphaEvolve от Google Gemini, в последнее время Сомани и его коллеги обнаружили, что GPT 5.2 демонстрирует чрезвычайную сноровку в решении математических задач высокого уровня.

С Рождества статус 15 задач на сайте Эрдеша был изменен с «открытых» на «решенные» — и в 11 случаях в примечаниях к решениям было прямо указано, что в процессе использовались модели искусственного интеллекта.

Известный математик Теренс Тао приводит более сдержанную статистику на GitHub. Он выделяет восемь примеров, где ИИ самостоятельно продвинулся в решении задач Эрдеша, и еще шесть — где нейросети помогли, отыскав и доработав старые научные труды. К моменту, когда искусственный интеллект сможет заниматься математикой совсем без помощи людей, еще далеко, однако роль больших моделей в этой области становится все более весомой.

На Mastodon Тао предположил, что масштабируемость систем ИИ делает их «лучше приспособленными для систематического применения к «длинному хвосту» малоизвестных задач Эрдеша, многие из которых на самом деле имеют простые решения.

«Да, многие из простейших задач Эрдеша теперь с большей вероятностью можно решить исключительно методами на основе искусственного интеллекта, чем человеческими или гибридными средствами», — отметил Тао.

Еще одной движущей силой является недавний переход к формализации — трудоемкого процесса, облегчающего проверку и развитие математических соображений. Формализация необязательно требует использования ИИ или даже компьютеров, однако появление новых автоматизированных инструментов значительно упростило эту задачу. Открытый «ассистент доказательств» Lean, разработанный в Microsoft Research в 2013 году, стал широко применяемым в этой области как средство формализации доказательств, а ШИ-инструменты, как Aristotle от Harmonic, обещают автоматизировать значительную часть этой работы.

Для основателя Harmonic Тюдора Ачима внезапный всплеск количества решенных задач Эрдеша весит меньше, чем тот факт, что самые выдающиеся математики мира начинают серьезно относиться к этим инструментам. «Меня больше волнует то, что профессора математики и компьютерных наук используют [ИИ-инструменты]», — сказал Ачим. «Эти люди заботятся о своей репутации, поэтому когда они заявляют, что пользуются Aristotle или ChatGPT, это и есть подлинное доказательство».

Не пропустите важное!
Подписывайтесь и получайте дайжест новостей

Ежедневно или еженедельно – выбираете вы!

Материалы по теме

Огляд ринків

Статьи • БОРГ-review
Понад 99% активів на ринку становлять саме токени. Станом на 2025 рік їхня кількість оцінюється в ~36 млн, тоді як криптовалют – близько десяти тисяч

Огляд ринків

Статьи • БОРГ-review
Блокчейн дозволяє людям діяти навіть там, де держава намагається закрити всі можливості, фактично виступаючи проти диктатури і цензури в будь-якій формі

Огляд ринків

Статьи • БОРГ-review
Не хочеться думати, що до розробки законів в Україні іноді долучаються випадкові люди

Огляд ринків

Статьи • БОРГ-review
Проблема в тому, що "спір про право" інколи перетворюється на штучний бар’єр для доступу до процедур банкрутства

Огляд ринків

Статьи • БОРГ-review
Санкційні активи можуть стати драйвером оновлення економіки, але лише тоді, коли держава гарантує інвесторам правову стабільність

Огляд ринків

Статьи • БОРГ-review
Для ефективного використання можливостей, наданих Законом №4564-ІХ, суб’єктам господарювання рекомендується ретельно переглянути статути своїх товариств