Китайский ИИ DeepSeek достиг уровня золотой медали на Международной математической олимпиаде

Китайский стартап DeepSeek установил новый стандарт в области искусственного интеллекта, представив модель Math-V2, которая демонстрирует уровень производительности, сравнимый с золотой медалью на Международной математической олимпиаде (IMO). Ежегодно проводимая с 1959 года IMO считается самым престижным в мире математическим соревнованием, задачи которого требуют глубокого понимания, творческого подхода и строгих рассуждений.
Модель Math-V2 стала широко доступной, будучи открытой для сообщества на платформах Hugging Face и GitHub под разрешительной лицензией, позволяющей разработчикам адаптировать и использовать систему. Модель продемонстрировала уровень золотой медали на задачах как этого года IMO, так и Китайской математической олимпиады 2024 года. Достижение этого уровня требует не только правильных ответов, но и прозрачной логики рассуждений — стандарта, которого достигают лишь около 8% участников-людей.
Открытый доступ к модели призван снизить барьеры для исследователей и разработчиков, стремящихся экспериментировать с продвинутым ИИ, способным решать задачи высокого уровня, — областью, которая традиционно находится под влиянием проприетарных систем. Исследователи DeepSeek подчеркивают, что дальнейшее развитие математических способностей искусственного интеллекта может оказать преобразующее влияние на научные исследования — от сложных симуляций до теоретического решения проблем.
Однако они предостерегают, что многие современные системы ИИ в основном оптимизированы для достижения высоких результатов на стандартных математических тестах, не обязательно улучшая базовые способности к рассуждению и решению задач, которые двигают реальные инновации. Для усиления строгости математических рассуждений своего ИИ DeepSeek сосредоточилась на том, чтобы модель могла «самопроверять» свои ответы, даже для задач без заранее известных решений. Эта способность к самопроверке позволяет ИИ оценивать последовательность и обоснованность своих рассуждений, обеспечивая надежность выводов как при наличии известных решений, так и при столкновении с новыми или нерешенными математическими проблемами.
Такой подход решает давнее ограничение в разработке ИИ: большинство систем показывают улучшение только на тех задачах, решения которых можно легко проверить. Способность к самопроверяемому рассуждению позволяет модели расширить свои возможности на более сложные, открытые проблемы. Исследователи отмечают, что, хотя значительная работа еще предстоит, эти результаты указывают на то, что самопроверяемые математические рассуждения являются перспективным направлением исследований, которое может проложить путь к более продвинутым и способным системам ИИ в математике и за ее пределами.
После завоевания золота на Международной математической олимпиаде Google DeepMind предоставил доступ к своей проприетарной модели подписчикам премиального плана Ultra, дав ограниченной группе разработчиков ранний доступ к продвинутому ИИ. В то же время генеральный директор OpenAI Сэм Алтман объявил, что экспериментальная модель компании, также заработавшая золотую медаль на IMO, останется недоступной для публики в течение многих месяцев. Подобные шаги подчеркивают различающиеся стратегии среди ведущих ИИ-компаний, где одни выбирают контролируемый доступ для защиты интеллектуальной собственности и обеспечения ответственного использования, а другие фокусируются на постепенном расширении доступности для исследователей и разработчиков.