Искусственный интеллект

Новая технология расширения памяти позволяет запускать крупные ИИ модели на обычных ПК

Ограничения оперативной памяти долгое время оставались одним из основных факторов, ограничивающих запуск крупных систем искусственного интеллекта на персональных компьютерах. В ряде случаев это приводило к необходимости переноса вычислений в облачные среды. Новые архитектурные подходы позволяют выполнять такие нагрузки локально на пользовательских системах.

Компания Phison Electronics представила технологию расширения памяти aiDAPTIV на выставке Computex 2026 в Тайбэе. Решение разработано совместно с Intel и предназначено для персональных компьютеров с поддержкой аппаратного ускорения задач искусственного интеллекта на базе процессоров Core Ultra Series 3.

Технология обеспечивает расширение доступного объёма рабочей памяти за счёт использования высокоскоростной флеш-памяти в дополнение к оперативной памяти. Часть данных и вычислительных операций переносится за пределы DRAM, что позволяет выполнять более крупные модели без увеличения объёма установленной оперативной памяти.

С увеличением сложности моделей искусственного интеллекта возрастает объём памяти, необходимый для обработки длинных контекстов, хранения промежуточных результатов и выполнения последовательных вычислений. В условиях ограниченного объёма DRAM это становится одним из основных ограничений при локальном запуске моделей.

Технология aiDAPTIV снижает нагрузку на оперативную память за счёт распределения данных между уровнями хранения. В основе используется механизм кэш-памяти aiDAPTIV Pascari, который управляет переносом данных между DRAM и флеш-накопителями.

Внутренние тесты Phison Electronics показывают, что модель с 26 миллиардами параметров может выполняться на системе с 16 гигабайтами оперативной памяти при включённой технологии aiDAPTIV. Без её использования для той же задачи требуется 32 гигабайта оперативной памяти.

Дополнительно реализована поддержка повторного использования кэша ключей и значений, что позволяет сохранять промежуточные данные вычислений и снижать объём повторной обработки контекста при генерации ответов.

Intel интегрирует технологию в экосистему персональных компьютеров с поддержкой искусственного интеллекта и обеспечивает совместимость с инструментарием OpenVINO toolkit, используемым для оптимизации и запуска моделей на аппаратных платформах Intel.

Генеральный директор Phison Electronics К. С. Пуа отметил, что персональные компьютеры с поддержкой искусственного интеллекта переходят к работе со сложными локальными сценариями, включая агентные системы и модели с архитектурой Mixture of Experts, которые предъявляют повышенные требования к объёму памяти и задержкам. По его словам, сотрудничество с Intel позволяет расширить доступные ресурсы и упростить запуск таких нагрузок на пользовательских системах.

На демонстрации в Тайбэе был показан локальный интерфейс чат-приложения, работающий с моделью Mixture of Experts, которая в стандартной конфигурации превышает объём оперативной памяти системы. Также представлена гибридная система обработки запросов, основанная на OpenClaw, сочетающая локальное выполнение задач и обращение к облачным ресурсам при необходимости обработки сложных запросов.

Intel отмечает, что ограничения памяти остаются одним из ключевых факторов, ограничивающих развитие локальных систем искусственного интеллекта на персональных компьютерах. Новые подходы к организации памяти расширяют диапазон моделей, которые могут выполняться без использования облачной инфраструктуры.

Подпишитесь на нас: Вконтакте / Telegram / Дзен Новости / MAX
Back to top button