Новые фотонные чипы позволяют нейросетям обучаться исключительно с помощью света
Исследователи из Китая совершили прорыв в области фотонных вычислений, создав чипы, которые позволяют нейросетям обучаться, используя исключительно свет, без необходимости преобразования сигналов в электронные. Эта технология способна значительно ускорить развитие автономных транспортных средств и помочь роботам обучаться непосредственно в ходе взаимодействия с реальным миром.
Разработанные чипы работают на основе так называемой фотонной спайковой нейронной системы — типа искусственного интеллекта, который имитирует принцип общения биологических нейронов с помощью быстрых импульсов. В новом устройстве роль таких импульсов играют короткие вспышки света, распространяющиеся по фотонным цепям значительно быстрее электронных сигналов.
Главное достижение ученых заключается в устранении узкого места, которое долгое время сдерживало развитие фотонного ИИ. В предыдущих системах свет мог использоваться только для линейных вычислений, тогда как нелинейные операции, критически важные для процесса обучения и принятия решений, требовали преобразования оптического сигнала обратно в электронный. Это преобразование создавало задержки и сводило на нет скоростные и энергетические преимущества фотоники.
Новая же разработка, возглавляемая Шуин Сян из Сидянского университета (Китай), позволяет выполнять как линейные, так и нелинейные нейронные вычисления непосредственно в оптической среде. Для демонстрации возможностей команда создала программируемую фотонную нейроморфную платформу, состоящую из двух чипов. Первый чип содержит 16-канальный нейроморфный процессор со 272 обучаемыми параметрами, способный обрабатывать несколько оптических сигналов одновременно. Второй чип оснащен массивом распределенно-обратных лазеров с насыщающимся поглотителем, что обеспечивает низкопороговую нелинейную оптическую импульсную активность.
Эффективность системы была проверена с помощью обучения с подкреплением — метода ИИ, основанного на методе проб и ошибок. Сначала нейронная модель обучалась в программной среде, после чего чипы выполняли обучение и вычисления непосредственно на аппаратном уровне. Затем исследователи проводили тонкую настройку результатов в софте, чтобы компенсировать незначительные аппаратные вариации.
Тестирование на двух классических задачах управления — удержании шеста на движущейся тележке (CartPole) и стабилизации перевернутого маятника — показало высокую точность. Решения, принятые аппаратным обеспечением, практически полностью совпали с программной моделью: точность снизилась всего на 1,5% для CartPole и на 2% для задачи с маятником. Вычислительная производительность также впечатляет: фотонная линейная обработка достигла 1,39 тера операций в секунду на ватт, нелинейная — почти 988 гига операций в секунду на ватт, а задержка на кристалле составила всего 320 пикосекунд.
Исследователи считают, что их технология станет основой для будущих систем ИИ, требующих высокой скорости обучения и низкого энергопотребления. Среди наиболее вероятных областей применения — автономное вождение и робототехника, где требуется мгновенная адаптация к изменяющимся условиям реальной среды. В настоящее время прототип использует 16 оптических каналов, но в планах команды — разработка 128-канального фотонного спайкового нейрочипа, который справится с более сложными задачами обучения, а также создание компактных гибридных фотонных систем для периферийных вычислений.
Результаты исследования в журнале Optica.