OpenAI и Cerebras запустили сверхбыстрый ИИ-помощник для мгновенных правок кода

Компания OpenAI представила GPT-5.3-Codex-Spark — свою первую модель искусственного интеллекта, изначально созданную для работы в режиме реального времени. Разработка способна генерировать более 1000 токенов в секунду и ориентирована на выполнение практических задач по разработке программного обеспечения. На данном этапе модель доступна в качестве исследовательской предварительной версии для подписчиков ChatGPT Pro.
GPT-5.3-Codex-Spark представляет собой облегченную версию более крупной модели GPT-5.3-Codex. Ключевой особенностью новинки стала оптимизация для сверхнизкой задержки, достигнутая в том числе благодаря использованию специализированного оборудования, разработанного в партнерстве с компанией Cerebras. В отличие от больших «фронтирных» моделей, рассчитанных на длительные автономные задачи, Codex-Spark сфокусирована на мгновенном взаимодействии с разработчиком. Пользователь может вносить точечные правки, перестраивать логику, уточнять интерфейсы и видеть результаты сразу же. Модель предназначена для совместного программирования, где скорость работы ценится не меньше, чем интеллектуальные способности.
На старте Codex-Spark поддерживает контекстное окно объемом 128 тысяч токенов и работает только с текстом. В рамках предварительного доступа для модели действуют отдельные тарифные лимиты, и её использование не учитывается в стандартных квотах пользователя. При этом OpenAI предупреждает, что в периоды высокой нагрузки возможны временные задержки и постановка запросов в очередь.
По умолчанию Codex-Spark настроена на минимальные и сфокусированные правки, избегая автоматического запуска тестов без прямой команды. Такой подход позволяет разработчику прерывать или перенаправлять модель прямо в процессе выполнения задачи, значительно ускоряя итерации. В тестах на профильных бенчмарках для разработчиков, таких как SWE-Bench Pro и Terminal-Bench 2.0, Codex-Spark показала высокую точность, при этом выполняя задачи в разы быстрее, чем GPT-5.3-Codex.
Скорость работы модели обеспечивается не только программной оптимизацией, но и инфраструктурными усовершенствованиями. OpenAI внедрила ряд изменений в свой серверный конвейер, что позволило сократить накладные расходы на обмен данными между клиентом и сервером на 80%, снизить время обработки одного токена на 30%, а время до появления первого токена — на 50%. Для Codex-Spark по умолчанию включено постоянное WebSocket-соединение; в ближайшее время эта функция будет распространена и на другие модели.
Основой аппаратной платформы для Codex-Spark стал Cerebras Wafer Scale Engine 3 — ускоритель, специально разработанный для высокоскоростного инференса. Это партнерство добавило уровень обслуживания с низкой задержкой в производственный стек OpenAI. Шон Ли, технический директор и сооснователь Cerebras, отметил, что компанию особенно вдохновляет возможность вместе с OpenAI и сообществом разработчиков исследовать потенциал быстрого инференса: новые паттерны взаимодействия, сценарии использования и принципиально иной опыт работы с моделью.
При этом OpenAI подчеркивает, что графические процессоры (GPU) по-прежнему остаются основой ее масштабных систем обучения и инференса. Решения Cerebras дополняют существующую инфраструктуру, фокусируясь исключительно на задачах, требующих экстремально низких задержек. В рамках одного рабочего процесса две системы могут быть объединены для балансировки скорости и эффективности.
С точки зрения безопасности Codex-Spark прошла тот же комплекс обучающих процедур, что и основные модели OpenAI, включая защиту от киберугроз. Согласно внутренней оценке компании, модель не достигает порогов, определяющих высокий уровень риска в областях кибербезопасности или биологии.
Релиз GPT-5.3-Codex-Spark обозначает первый шаг к созданию двухрежимной системы Codex, которая будет сочетать возможности совместной работы в реальном времени с долгосрочным планированием и рассуждениями. В будущих обновлениях разработчики планируют расширить функциональность, предлагая более крупные модели, увеличенные контекстные окна и поддержку мультимодальных входных данных.