Искусственный интеллект

DALL-E 2: ИИ, генерирующий изображения из текста

Компания Open AI создала новый вид "художника". DALL-E 2, как известно, представляет собой искусственный интеллект (ИИ), способный преобразовать практически любую запрашиваемую ситуацию в изображение на основе простого текстового описания.

"DALL-E 2 - это новая система искусственного интеллекта, способная создавать реалистичные изображения и произведения искусства из описания на естественном языке", — говорится в резюме на сайте проекта. Фактически это система, способная буквально "превращать слова в образы". Все, что вам нужно сделать, это описать изображение, которое вы хотите получить, и искусственный интеллект составит то, что ему соответствует.

Недавно внимание также привлек GauGAN2, еще один довольно похожий ИИ. Если DALL-E 2 и отличается от этого инструмента, то в основном тем, что не ограничивается пейзажами. И даже если на то пошло, изображения, близкие к тем, что можно найти в реальности.

DALL-E 2, по словам его создателей, может комбинировать концепции, атрибуты и стили для создания изображений, которые точно соответствуют тексту. Мира Мурати, сотрудник компании, смогла получить следующее изображение на запрос: "35-мм макрофотография большой семьи мышей в шляпах, уютно расположившихся у огня".

ИИ также может редактировать существующие изображения. Просто выберите область, которую необходимо изменить, и укажите, что нужно удалить или добавить. Он может на лету изменять композицию, тени, текстуры и т.д. Эта функция является дополнением по сравнению с первой версией DALL-E, выпущенной в январе 2021 года. Этот старший брат, о котором начали рассказывать в январе 2022 года, "генерирует более реалистичные и точные изображения в 4 раза большим разрешением", как утверждают его разработчики.

Чтобы развернуть весь этот творческий потенциал, "DALL-E 2 изучил отношения между изображениями и текстом, используемым для их описания", — объясняет Open AI. Как это часто бывает, то, что здесь объединяется под довольно широким термином "искусственный интеллект", на самом деле правильнее было бы назвать "машинным обучением". Для "обучения" DALL-E использует так называемую нейронную сеть.

Нейронная сеть называется так потому, что в ее основе лежит система, вдохновленная функционированием биологических нейронов, которая получила дальнейшее развитие в статистических методах. Говоря конкретнее, искусственный интеллект "питается" большим количеством данных для извлечения логических связей и обработки их до результата. Таким образом, пища для этого ИИ состояла из огромного количества изображений, связанных с текстовыми метками. Исследователи компании подробно описывают этот процесс в своем исследовании.

Этот ИИ также использует процесс, называемый "диффузией". Идея заключается в том, чтобы начать с узора из случайных точек и постепенно изменить этот узор на изображение, когда распознаются определенные аспекты. Конечно, как отмечает компания, все это прекрасное творчество может быть легко подорвано, если в систему будут введены неправильно маркированные изображения. Например, ребенок учит неправильное слово для обозначения предмета.

Компания также указывает на возможные недостатки использования DALL-E 2: "Без достаточных мер предосторожности модели, подобные DALL-E 2, могут быть использованы для создания широкого спектра вводящего в заблуждение и иным образом вредного контента, и могут повлиять на то, как люди воспринимают подлинность контента в целом. DALL-E 2 также наследует различные предубеждения от своих обучающих данных, и его результаты иногда усиливают общественные стереотипы". Поэтому на данный момент доступ к инструменту ограничен, и вы должны записаться в список ожидания, чтобы получить возможность протестировать его.

Подписывайтесь на нас
Back to top button