Alibaba представила мультимодальную AI-модель Qwen2.5-Omni-7B для работы на смартфонах и ноутбуках

Китайский технологический гигант Alibaba Group Holding анонсировал новую мультимодальную модель искусственного интеллекта Qwen2.5-Omni-7B, способную обрабатывать текст, изображения, аудио и видео прямо на мобильных устройствах и ноутбуках.
Локальный ИИ с расширенными возможностями
Модель Qwen2.5-Omni-7B, представленная 20 июня, стала новейшим дополнением к линейке Qwen. Несмотря на относительно небольшой размер (7 миллиардов параметров), она демонстрирует высокую производительность и оптимизирована для работы на смартфонах, планшетах и ноутбуках. Это делает передовые ИИ-технологии более доступными для рядовых пользователей.
Alibaba заявила, что модель способна обрабатывать различные типы данных и генерировать ответы в реальном времени в виде текста или аудио. Компания также сделала Qwen2.5-Omni-7B open-source, разместив ее на платформах Hugging Face, GitHub и ModelScope. Кроме того, модель уже интегрирована в чат-бот Qwen Chat.
Практическое применение
Среди потенциальных сценариев использования Alibaba выделяет:
- Помощь слабовидящим — модель может озвучивать описания окружающей среды в реальном времени.
- Кулинарные подсказки — анализ ингредиентов и пошаговые инструкции по приготовлению блюд.
- Универсальные мультимодальные задачи — обработка изображений, видео и аудио без необходимости подключения к облачным серверам.
Высокие результаты в тестах
Qwen2.5-Omni-7B показала впечатляющие результаты в бенчмарках:
- OmniBench: 56.1 балла (против 42.9 у Google Gemini-1.5-Pro).
- CV15 (аудио): 92.4 балла, что на 1 пункт выше, чем у предыдущей модели Alibaba — Qwen2-Audio.
- M3B (мультимодальное понимание): 59.2 балла, превзойдя Qwen2.5-VL.
Тренд на локальные и мультимодальные модели
Новая разработка Alibaba соответствует глобальному тренду на эффективные ИИ-модели, способные работать локально без постоянного интернет-подключения. Это не только ускоряет обработку данных, но и решает вопросы конфиденциальности.
С выходом Qwen2.5-Omni-7B Alibaba укрепляет свои позиции в гонке ИИ-технологий, предлагая компактную, но мощную модель, которая может работать на обычных устройствах. Это открывает новые возможности для разработчиков и пользователей, делая сложные ИИ-функции более доступными.