Технологии

Microsoft бросила вызов NVIDIA, представив чип Maia 200 и открытый фреймворк Triton

Корпорация Microsoft представила чип Maia 200 второго поколения собственной разработки, нацеленный на выполнение логических выводов (инференса) искусственного интеллекта. Запуск происходит на фоне обостряющейся конкуренции вокруг стоимости эксплуатации больших моделей, которая становится серьезной статьей расходов для ИИ-компаний по мере масштабирования чат-ботов и помощников до миллионов пользователей. В отличие от предыдущих аппаратных решений, сфокусированных на обучении моделей, Maia 200 создан именно для инференса — непрерывного процесса генерации ИИ-ответов, требующего скорости, стабильности и энергоэффективности.

Новый чип начинает работу на этой неделе в дата-центре Microsoft в Айове, а следующее развертывание запланировано в Аризоне. Maia 200, являющийся развитием модели Maia 100 2023 года, содержит более 100 миллиардов транзисторов и обеспечивает производительность свыше 10 петафлопсов при 4-битной точности. При 8-битной точности этот показатель составляет около 5 петафлопсов. Эти цифры ориентированы на реальные рабочие нагрузки, а не на бенчмарки для обучения. Компания заявляет, что один узел с чипом Maia 200 способен запускать самые большие современные ИИ-модели с запасом на будущий рост.

Конструкция чипа отражает принципы работы современных ИИ-сервисов. Для быстрого реагирования даже при скачках пользовательского трафика Maia 200 оснащен большим объемом SRAM — высокоскоростной памяти, сокращающей задержки при повторяющихся запросах. Этот подход, который используют несколько новых игроков на рынке ИИ-чипов, позволяет повысить отзывчивость систем при масштабировании.

Запуск Maia 200 также имеет стратегическое значение, так как крупные облачные провайдеры стремятся снизить зависимость от NVIDIA, чьи GPU доминируют в ИИ-инфраструктуре. Microsoft теперь присоединяется к Google с его тензорными процессорами (TPU) и Amazon Web Services с чипами Trainium и Inferentia. Компания напрямую сравнивает свое решение с продуктами конкурентов: по заявлению Microsoft, Maia 200 демонстрирует трехкратное превосходство в производительности FP4 по сравнению с чипами Trainium третьего поколения от Amazon, а также более высокую производительность FP8, чем у последнего TPU от Google.

Чип Maia 200, как и будущие процессоры Vera Rubin от NVIDIA, производится компанией Taiwan Semiconductor Manufacturing Co по 5-нанометровой технологии и использует высокоскоростную память, хотя и предыдущего поколения по сравнению с новейшими чипами NVIDIA.

Параллельно с чипом Microsoft представила новые инструменты для разработчиков, стремясь сократить разрыв в программном обеспечении, который долгое время был преимуществом NVIDIA. Ключевым инструментом стал открытый фреймворк Triton, помогающий писать эффективный код для ИИ, на который внесла большой вклад OpenAI. Microsoft позиционирует Triton как альтернативу доминирующей платформе программирования CUDA от NVIDIA.

Maia 200 уже используется внутри собственных ИИ-сервисов Microsoft, поддерживая модели команды Superintelligence и работу Copilot. Компания также пригласила сторонних разработчиков, академических исследователей и передовые ИИ-лаборатории протестировать комплект разработки программного обеспечения (SDK) для Maia 200. Этим запуском Microsoft обозначает более широкий сдвиг в ИИ-инфраструктуре, где контроль над программным обеспечением и развертыванием стал не менее важен, чем скорость самих чипов.

Подпишитесь на нас: Вконтакте / Telegram / Дзен Новости
Back to top button