Google DeepMind создал ИИ, который генерирует видеоигры из текста или одного изображения

07.03.2024

2 738

Создавать видеоигры еще никогда не было так просто... Теперь вам не нужно осваивать программирование, чтобы разработать основы, благодаря новому искусственному интеллекту от Google. 26 февраля компания Google DeepMind анонсировала проект Genie, в рамках которого будет создана система, способная генерировать видеоигры на основе простой текстовой инструкции или одного изображения.

В последние годы написание текстов, создание изображений и воспроизведение звуков, музыки и видео постепенно становится доступным для широкой аудитории при условии, что у нее есть доступ к соответствующему ИИ. Эта новая технология позволяет получить навыки, которые раньше были уделом узкоспециализированных профессионалов.

В последнее время пределы возможностей ИИ вновь были отодвинуты. Новая модель теперь способна создавать видеоигры по запросу. За этим стоит DeepMind - компания Alphabet (включая Google), занимающаяся разработкой искусственного интеллекта, — и ее сотрудничество с Университетом Британской Колумбии (Канада). Инструмент, представленный в феврале, называется "Genie", сокращение от "Generative Interactive Environments".

Создание видеоигр одним нажатием кнопки благодаря сочетанию инновационных технологий

Имея 11 миллиардов параметров, модель искусственного интеллекта сочетает в себе несколько технологий для создания видеоигр, используя одну текстовую инструкцию или изображение. В частности, она использует "токенизатор" - систему, которая преобразует видеоизображения в "токены" - единицы информации, которые могут быть обработаны ИИ. Такое преобразование позволяет свести сложные визуальные данные к более простым элементам, которыми модель может легко манипулировать для изучения последовательностей действий в видеоиграх.

ИИ также опирается на модель скрытых действий, позволяющую ему анализировать изображения и понимать, какие действия могут происходить в зависимости от контекста. Благодаря этой модели он может создавать последовательности действий для игр, которые он генерирует. Этот набор технологий дает Genie возможность создавать целую игровую среду на основе одной подсказки или изображения. Он создает фоновые изображения, а также все элементы декораций, игровые объекты и персонажей.
200 000 часов видеообучения

Первоначально Genie обучали на 200 000 часах видео из классических 2D-видеоигр. Эти материалы были взяты из общедоступных источников. Чтобы максимально повысить релевантность видео, оно было отфильтровано до 30 000 часов. Обучение Genie проходило без непосредственного контроля со стороны человека. Более того, ИИ не получал никакой информации о командах игроков (в частности, о нажатии кнопок), но, тем не менее, смог понять фундаментальные принципы игр. Система смогла определить, как персонажи двигаются, прыгают и взаимодействуют с окружающей средой.

По качеству и разрешению Genie все еще далека от современных графических стандартов индустрии видеоигр. Разрешение игр, созданных ИИ, составляет всего 160 x 90 пикселей, а частота кадров - 10 в секунду. Однако стоит отметить, что Genie - это еще не готовый продукт. На данном этапе это просто исследовательский проект.

В любом случае, по мере развития технологии и проведения новых исследований можно быть уверенным, что возможности этой модели и будущих подобных систем будут стремительно расти. То же самое, несомненно, произойдет и с качеством и разрешением создаваемых игр.

07.03.2024

2 738