Новое исследование раскрывает уникальное преимущество человеческого мозга перед искусственным интеллектом

Большинство из нас даже не задумывается о том, насколько сложно и одновременно естественно наш мозг решает, как перемещаться в новой обстановке — идти, карабкаться или плыть. За доли секунды, без осознанных усилий, он анализирует окружение и подсказывает, как действовать. Даже самые передовые системы искусственного интеллекта (ИИ) пока не способны повторить этот процесс.
Согласно новому исследованию, эта удивительная способность, которую мы воспринимаем как данность, основана на специализированных нейронных процессах, которые ИИ пока не может воспроизвести, несмотря на стремительное развитие технологий.
Учёные из Амстердамского университета выяснили, как человеческий мозг кодирует так называемые «локомоторные аффордансы» — возможности для движения, которые предоставляет окружающая среда. Их работа, опубликованная в журнале PNAS Neuroscience, проливает свет на то, как мы мгновенно определяем, можно ли пройти через поле, перелезть через камни или нырнуть в воду, просто взглянув на сцену.
Особенно важно, что исследование подчёркивает: глубокие нейронные сети (DNN) — системы ИИ, вдохновлённые биологическим мозгом, — не способны воспроизвести этот фундаментальный аспект человеческого восприятия.
Результаты указывают на глубокое различие между естественным и искусственным интеллектом, что имеет значение для робототехники, беспилотных автомобилей и других областей. Хотя ИИ достиг больших успехов в распознавании объектов и классификации сцен, он всё ещё не понимает, какие действия возможны в этих сценах.
«Даже лучшие модели ИИ не дают таких же ответов, как люди, хотя для нас это элементарная задача», — объяснила соавтор исследования, вычислительный нейробиолог доктор Ирис Грун в пресс-релизе. «Это показывает, что наше восприятие глубоко связано с тем, как мы взаимодействуем с миром. Мы связываем восприятие с нашим опытом в физическом мире. Модели ИИ не могут этого сделать, потому что существуют только в компьютере».
Учёные объединили методы визуализации мозга, поведенческие эксперименты и анализ машинного обучения. Добровольцам показывали изображения различных сцен, а их мозговую активность фиксировали с помощью функциональной МРТ (фМРТ). Целью было определить, как мозг кодирует возможности для движения: ходьбу, лазание, плавание, ползание, прыжки или полёт.
«Мы хотели выяснить: когда вы смотрите на сцену, видите ли вы только то, что там есть — объекты или цвета, — или же автоматически понимаете, что с этим можно сделать», — пояснила доктор Грун. «Психологи называют это "аффордансами" — возможностями для действия. Например, лестница, по которой можно подняться, или открытое поле, через которое можно пробежать».
Данные показали, что определённые области зрительной коры — особенно те, что отвечают за обработку сцен, — активируются в паттернах, которые напрямую кодируют типы движений, возможные в данной среде. Интересно, что эти паттерны отличались от тех, которые связаны с распознаванием объектов, поверхностей или общих категорий сцен. Это говорит о том, что мозг выделяет отдельные механизмы для понимания возможных действий в окружающем пространстве.
Параллельно исследователи протестировали несколько глубоких нейронных сетей, обученных на стандартных задачах, таких как распознавание объектов или классификация сцен. Эти ИИ-модели могли определить, изображена ли на картинке кухня, лес или городская улица, но плохо справлялись с пониманием того, какие действия допустимы в этих условиях.
Результаты показали, что соответствие между активностью ИИ и паттернами человеческого мозга было слабым в вопросах локомоторных аффордансов, хотя в задачах, связанных с объектами, оно было высоким.
Затем команда попыталась донастроить модели, обучая их классифицировать изображения по аффордансам или используя языковые модели, ориентированные на возможности действий. Хотя это немного улучшило соответствие, ни одна из систем не смогла полностью воспроизвести тонкий способ, которым человеческий мозг представляет двигательные возможности. Разрыв между восприятием человека и машины остаётся значительным.
«Когда модели обучали специально для распознавания действий, они могли приблизиться к человеческим оценкам, но паттерны мозга не совпадали с внутренними вычислениями ИИ», — отметила доктор Грун.
Один из ключевых выводов исследования заключается в том, что понимание того, как мы ориентируемся в мире, требует не просто распознавания объектов, а осознания возможных действий. Наш мозг делает это автоматически, без сознательных усилий и явных инструкций.
«Наши результаты показывают, что восприятие локомоторных аффордансов в сценах опирается на специализированные нейронные представления, отличные от тех, что используются для других задач зрительного понимания», — пишут исследователи. «Обучение DNN на метках аффордансов или использование языковых моделей, ориентированных на действия, повышает соответствие с человеческим поведением, но ни одна из протестированных моделей не воспроизводит восприятие двигательных возможностей в полной мере».
Исследование открывает новые перспективы для улучшения систем ИИ, особенно тех, что предназначены для работы в динамичных средах. Более точные модели восприятия аффордансов могут революционизировать беспилотные автомобили, роботов-доставщиков и даже виртуальных ассистентов, позволяя им взаимодействовать с миром более человекообразно.
Пока же работа напоминает, как много нам ещё предстоит узнать о нашей собственной биологии. ИИ уже превзошёл человека в таких задачах, как игра в шахматы или анализ больших данных, но когда дело доходит до интуитивного понимания пространства и движения, мы по-прежнему впереди. Именно это позволяет ребёнку ловко взбираться по игровой площадке или взрослому уверенно идти по оживлённой улице.
Результаты также подчёркивают, что интеллект — это не просто обработка данных или поиск шаблонов. Человеческий мозг видит возможности для действия, объединяя восприятие и потенциал так, как современные ИИ только начинают осознавать.
Подобные исследования крайне важны для развития искусственного интеллекта. Учёные надеются, что новые данные помогут создать следующее поколение ИИ-систем, способных ориентироваться в мире с той же эффективностью и экономией энергии, что и человеческий мозг.
«Современные методы обучения ИИ требуют огромных затрат энергии и часто доступны только крупным технологическим компаниям», — отметила доктор Грун. «Больше знаний о том, как работает наш мозг и как он быстро и эффективно обрабатывает информацию, поможет сделать ИИ умнее, экономичнее и дружелюбнее к человеку».