Искусственный интеллект

OpenAI представила GPT-5.6 с ограниченным доступом по запросу правительства США

Компания OpenAI официально представила новое семейство больших языковых моделей GPT-5.6, в которое вошли флагманская модель Sol, а также версии Terra и Luna, предназначенные для различных сценариев использования с учётом производительности и стоимости. Однако запуск новых моделей пройдет поэтапно: первоначально доступ к ним получит лишь ограниченный круг проверенных партнёров из США. Такое решение было принято после соответствующего запроса со стороны правительства Соединённых Штатов.

В OpenAI сообщили, что линейка GPT-5.6 вводит новую систему наименований моделей. Модель Sol занимает высший уровень по возможностям, Terra обеспечивает производительность, сопоставимую с GPT-5.5, но при этом обходится примерно в два раза дешевле, а Luna ориентирована на более быстрые и экономичные приложения искусственного интеллекта. Компания планирует сделать все три модели доступными через ChatGPT, Codex и свой API в течение ближайших недель.

Одним из ключевых нововведений GPT-5.6 Sol стал новый режим максимального рассуждения, который позволяет модели тратить больше времени на решение особенно сложных задач. Одновременно OpenAI представила режим Ultra, использующий систему субагентов для выполнения комплексных рабочих процессов, которые выходят за пределы возможностей одного ИИ-агента.

По данным компании, GPT-5.6 Sol демонстрирует самые высокие результаты OpenAI в области программирования, биологии и кибербезопасности. Кроме того, новая модель получила наиболее совершенную на сегодняшний день систему защиты, разработанную компанией.

В области программирования GPT-5.6 Sol достигла нового лучшего результата на тесте TerminalBench 2.1, предназначенном для оценки моделей в задачах командной строки. В биологии модель превзошла GPT-5.5 в бенчмарке GeneBench v1, при этом используя меньше выходных токенов.

Заметные улучшения были достигнуты и в сфере кибербезопасности. В тесте ExploitBench GPT-5.6 Sol показала уровень производительности, сопоставимый с моделью Mythos Preview компании Anthropic, однако при этом использовала примерно треть от количества выходных токенов. В испытаниях ExploitGym, разработанных исследователями Калифорнийского университета в Беркли совместно с OpenAI и другими лабораториями, все три модели семейства GPT-5.6 продемонстрировали рост возможностей в области кибербезопасности по мере увеличения глубины рассуждений.

Несмотря на достигнутые результаты, OpenAI подчёркивает, что GPT-5.6 Sol не преодолевает порог Cyber Critical в рамках собственной системы оценки рисков Preparedness Framework. По словам компании, модель значительно эффективнее помогает специалистам обнаруживать и устранять уязвимости, чем самостоятельно проводить полноценные кибератаки от начала до конца.

Для повышения безопасности OpenAI внедрила многоуровневую систему защиты, которая объединяет встроенные механизмы модели, обнаружение злоупотреблений в режиме реального времени, мониторинг учётных записей пользователей, разграничение уровней доступа, а также масштабное автоматизированное и ручное тестирование. Компания также сообщила, что до выпуска моделей было затрачено более 700 тысяч GPU-часов, эквивалентных работе ускорителей NVIDIA A100, на автоматизированное тестирование с целью выявления способов обхода защитных механизмов.

При этом OpenAI подчёркивает, что не считает подобную практику предварительного ознакомления правительства с новыми моделями оптимальным долгосрочным решением. В компании заявили, что рассматривают нынешний подход как временную меру, одновременно работая совместно с администрацией США над созданием прозрачной и воспроизводимой процедуры выпуска передовых моделей искусственного интеллекта в будущем.

Генеральный директор OpenAI Сэм Альтман также подтвердил эту позицию в социальной сети X. По его словам, именно правительство США попросило провести ограниченный предварительный запуск вместо более широкого релиза, который первоначально планировала компания. Альтман отметил, что OpenAI намерена как можно быстрее предоставить GPT-5.6 широкому кругу пользователей, одновременно вырабатывая понятный и прозрачный механизм взаимодействия с государственными структурами при выпуске будущих моделей.

Подпишитесь на нас: Вконтакте / Telegram / Дзен Новости / MAX
Back to top button