ИИ нашёл доказательство века: как ChatGPT решил сложную математическую задачу сам
ИИ-модели начали справляться с высокоуровневой математикой: реальные примеры прогресса
Generated by DALL·E
В последние дни разработчик и исследователь Neel Somani обнаружил то, что многие считали почти невозможным: новая версия ChatGPT самостоятельно решила сложную задачу по математике, причисляемую к так называемым «открытым» проблемам. Somani, имеющий опыт работы в области количественных исследований и стартапов, вставил задачу в чат-модель и оставил её «думать» на 15 минут. Когда он вернулся, система уже выдала полный ответ, который он проверил и формализовал с помощью инструмента Harmonic — и выяснил, что доказательство оказалось корректным.
Somani объяснил, что его первоначальный интерес заключался в том, чтобы определить, с какого уровня сложности большие языковые модели (LLM) действительно способны решать открытые математические задачи и где они терпят неудачу. По его словам, результаты с последней моделью оказались неожиданно впечатляющими и продвинули этот «предел» вперёд.
В ходе сессии ChatGPT не просто выдал ответ: модель продемонстрировала уверенное владение рядом глубоких математических аксиом и формул, перечисляя такие элементы, как формула Лежандра и постулат Бертрана, прежде чем найти и оперировать идеями, опубликованными ещё в 2013 году на MathOverflow. Там американский математик Ноам Элкис предлагал своё элегантное решение близкой по смыслу задачи, но окончательный вывод, который выдала модель, отличался от него и оказался более исчерпывающим для варианта, заданного легендарным математиком Паулем Эрдёшем.
Согласно Somani, с момента выхода версии GPT 5.2 модели стали заметно лучше справляться с математическими рассуждениями, и число задач, которые они решают, выросло до такой степени, что это уже трудно игнорировать. Многие из этих решений были сделаны без прямого участия человека, что вызывает вопросы о том, насколько далеко такие системы способны продвинуть границы человеческих знаний.
Somani отметил, что первые полностью автономные решения подобных задач появились ещё в ноябре в одной из моделей на основе Gemini под названием AlphaEvolve, но именно в последние недели GPT 5.2 продемонстрировал особенно сильную способность решать высокоуровневые математические проблемы.
Даже видные математики, такие как Терренс Тао, согласно Somani, высказывают более взвешенную оценку таких достижений: они указывают на то, что масштабируемость ИИ делает его особенно подходящим для систематической работы с «длинным хвостом» задач Эрдёша, многие из которых имеют относительно прямолинейные решения, пусть и ранее не были решены человеком.
Эксперты считают, что такой прогресс в применении больших языковых моделей к открытым математическим проблемам не отменяет роли человека, но укрепляет позицию ИИ как важного инструмента в арсенале современного математического сообщества.