Искусственный интеллект

Новая модель GPT-5.5 от OpenAI самостоятельно выполняет сложные задачи без пошагового контроля пользователя

Компания OpenAI представила модель GPT-5.5, позиционируя её как самую мощную и интуитивно понятную на сегодняшний день. Основной акцент в новой разработке сделан на помощи пользователям в выполнении сложных многоэтапных задач с большей степенью самостоятельности со стороны искусственного интеллекта. Этот релиз знаменует собой продолжение движения OpenAI в сторону «агентных» систем ИИ, которые способны планировать, выполнять и корректировать работу при минимальном вмешательстве человека.

По заявлению компании, модель улучшает взаимодействие пользователей с ИИ в области программирования, исследований и общей интеллектуальной работы. Вместо того чтобы направлять каждый шаг, пользователи теперь могут поручать модели более широкие задачи, полагаясь на её способность ориентироваться в неоднозначных условиях и полностью выполнять рабочие процессы. В OpenAI подчеркнули, что GPT-5.5 быстрее понимает цели пользователя и может взять на себя большую часть работы.

Особенно заметны достижения GPT-5.5 в программировании, особенно в сложных рабочих процессах, требующих планирования и координации с инструментами. На бенчмарке Terminal-Bench 2.0 модель достигла точности 82,7%, что является передовым результатом. На тесте SWE-Bench Pro она показала результат 58,6%, решив больше реальных задач с GitHub за один проход, чем предыдущие версии. Модель также превзошла своего предшественника в длительных инженерных задачах по внутренним метрикам компании, при том что на выполнение таких задач у разработчиков-людей уходит до 20 часов.

В OpenAI отметили, что улучшения не ограничиваются контрольными показателями. Ранние тестировщики сообщили, что GPT-5.5 лучше понимает архитектуру систем и точки отказа: она способна определять, куда именно нужно вносить исправления, и прогнозировать последствия изменений для всей кодовой базы. Компания также подчеркнула эффективность новой модели: GPT-5.5 обеспечивает ту же задержку на токен, что и GPT-5.4, несмотря на более высокий интеллект. Более того, модель использует меньше токенов для выполнения тех же задач, снижая вычислительные затраты. В OpenAI заявили, что этот скачок в интеллекте достигнут без компромиссов в скорости.

Помимо программирования, GPT-5.5 расширяет свою роль в повседневной интеллектуальной работе. Модель может переключаться между такими задачами, как сбор информации, анализ данных и создание структурированных результатов, включая документы и электронные таблицы. В OpenAI отмечают, что это отражает более широкий сдвиг в сторону систем ИИ, способных активно управлять программным обеспечением и инструментами: модель интерпретирует интерфейсы, совершает действия и переходит между рабочими процессами с минимальными усилиями.

Внутреннее внедрение модели в OpenAI подтверждает эти возможности: более 85% сотрудников компании теперь еженедельно используют Codex в различных отделах, включая инженерный, финансовый и маркетинговый. В одном из примеров команда по коммуникациям использовала GPT-5.5 для обработки данных о запросах на выступления за полгода: система построила систему оценки и управления рисками и помогла автоматизировать одобрение низкорисковых заявок. В финансовом отделе модель проанализировала 24 771 налоговую форму K-1 общим объёмом более 71 000 страниц, что сократило время обработки на две недели. Другая команда автоматизировала еженедельную бизнес-отчётность, экономя от пяти до десяти часов каждую неделю.

OpenAI также уделила особое внимание безопасности при развёртывании новой модели. Компания сообщила, что внедрила свои самые надёжные на сегодняшний день меры защиты, включая «красные команды», расширенное тестирование и обратную связь от почти 200 партнёров из программы раннего доступа. GPT-5.5 уже доступна пользователям тарифов Plus, Pro, Business и Enterprise в ChatGPT и Codex. Доступ к API будет открыт позже, после выполнения дополнительных требований по безопасности и масштабированию.

Подпишитесь на нас: Вконтакте / Telegram / Дзен Новости / MAX
Back to top button