Пять лучших генеративных ИИ для создания потрясающих изображений

01.04.2023

2 814

Создавайте изображения с нуля с помощью простого описания, используя специальные программы искусственного интеллекта.

Запуск ChatGPT в конце ноября прошлого года стал настоящим ударом для многих. Он дал широкой публике реальное ощущение силы программы искусственного интеллекта. Благодаря ChatGPT весь мир смог увидеть огромный потенциал искусственного интеллекта. Разговорный робот OpenAI впечатляет. Вы можете разговаривать с ним, как с близким человеком, он "понимает" вас, отвечает на ваши вопросы, выполняет ваши указания и делает все это на естественном языке, как и любой человек (по крайней мере, на первый взгляд).

Хотя ChatGPT стал для многих настоящей неожиданностью, это лишь малая часть того, на что способна программа искусственного интеллекта. Существует множество других столь же мощных инструментов, основанных на искусственном интеллекте. И вы будете удивлены. Программы искусственного интеллекта, над которыми работают исследователи, совершенствуются во многих других областях, многие из которых пока неизвестны обычному человеку. Так, например, обстоит дело с программами ИИ, специализирующимися на создании изображений.

Подобно тому, как ChatGPT может создавать текст из нескольких инструкций, существуют программы, способные создавать изображения с нуля, из простого текстового описания. Чтобы работать, эти ИИ, как и ChatGPT, были накормлены и обучены сотнями тысяч данных. В данном случае, вероятно, миллиарды изображений всех видов. И эти ИИ стали настолько хороши, что создают изображения, достойные человеческих художников. Не случайно картина, созданная Midjourney, одним из самых мощных генеративных ИИ на сегодняшний день, несколько месяцев назад победила на художественном конкурсе.

Но их мощь начинает вызывать беспокойство. Некоторые художники без колебаний обвиняют эти программы искусственного интеллекта в плагиате. На эти ИИ буквально показывают пальцем, потому что они обучались, в большинстве случаев, на изображениях без разрешения их авторов. Для некоторых художников эти генеративные ИИ стали просто пиратским копированием миллиардов произведений искусства.

Некоторые из этих программ ИИ более совершенны, чем другие. И многие из них уже доступны широкой публике. Мы рассмотрели несколько из них, отобрали те, которые можно использовать бесплатно, и оставили только лучшие.

1. Midjourney

До появления фальшивых фотографий Папы Римского в стильном пиджаке вы, возможно, не слышали о Midjourney. Однако эта программа искусственного интеллекта является одной из самых передовых на сегодняшний день. Доступная в публичной бета-версии, для которой необходимо зарегистрироваться - и свободный доступ к которой, похоже, закрыт на неопределенный или постоянный срок - Midjourney существует в виде бота Discord. Если вы хотите опробовать его, вам придется сначала загрузить Discord, создать учетную запись и присоединиться к серверу Midjourney Discord. Процедура подробно описана в документации Midjourney. Первая подписка стоит $10 в месяц при ежемесячной тарификации или $8 в месяц при годовой тарификации.

После регистрации в Discord и присоединения к серверу Midjourney вы можете начать задавать вопросы боту, вызвав его в одной из специальных комнат (новички) с помощью команды /imagine, за которой следует ваше описание (также называется prompt). Через несколько секунд бот сгенерирует четыре изображения, соответствующие вашему запросу. Под сгенерированными изображениями есть несколько пронумерованных кнопок U, позволяющих получить увеличенные версии с более подробным описанием. Кнопки V, также пронумерованные, позволяют генерировать вариации только что созданных изображений. А если вы не удовлетворены результатом, вы можете сгенерировать новые изображения с тем же запросом, нажав на кнопку с двумя круговыми стрелками.

Результаты, полученные с помощью Midjourney, просто поразительны. Эта программа генеративного искусственного интеллекта на данный момент является самой впечатляющей из всех, которые мы тестировали. Однако бесплатная версия Midjourney, действие которой на момент написания статьи было приостановлено, дает вам только 25 бесплатных кредитов для тестирования инструмента. После этого вам придется оформить платную подписку.

2. Stable Diffusion

Среди моделей машинного обучения, способных генерировать реалистичные изображения на основе описания на естественном языке, Stable Diffusion также занимает достойное место. Ее главная особенность в том, что ее исходный код доступен для всех - создатель Stability AI опубликовал его на Github. Его можно использовать прямо из браузера через веб-приложения, такие как DreamStudio. Регистрация на онлайн-сервисе бесплатна и позволяет по умолчанию воспользоваться сотней кредитов, что соответствует генерации около 500 изображений. Это количество может быть уменьшено в зависимости от требуемого размера и уровня детализации. Все созданные вами изображения, а также их подсказки записываются в историю. Однако их превью хранятся не на серверах сервиса, а только в кэше вашего браузера. Поэтому не забывайте сохранять те из них, которые вам больше всего подходят.

Вы также можете запустить Stable Diffusion локально на компьютере, используя, например, такой инструмент, как Easy Diffusion. Запустив Stable Diffusion на своей машине, вы сможете неограниченно использовать ИИ для создания своих изображений. Однако имейте в виду, что для этого вам потребуется машина с мощной конфигурацией, включая специальную видеокарту. Генерация изображений с помощью Stable Diffusion особенно ресурсоемка.

3. Bing Image Creator

Вот уже несколько недель Bing, поисковая система Microsoft, может генерировать изображения на основе простого описания. Модуль, посвященный этой практике, Bing Image Creator, доступен из любого веб-браузера по этому адресу.

Пока еще находясь на стадии предварительного просмотра, Bing Image Creator в конечном итоге должен быть постоянно интегрирован в режим Bing Conversation. Чтобы создать свою службу создания изображений, Microsoft не пошла далеко. Компания из Редмонда просто положилась на Dall-E, генеративную модель искусственного интеллекта от OpenAI, создателя ChatGPT, на котором основан режим Bing Conversation. Хотя Bing Image Creator является бесплатным для использования, сервис требует наличия учетной записи Microsoft и подключения к Bing. После этого вы можете начать генерировать изображения, введя простое текстовое описание в соответствующее поле.

Однако обратите внимание, что Microsoft предусмотрела систему дополнительных возможностей, которые позволят вам быстрее генерировать изображения. По умолчанию при первом использовании службы у вас будет 25 бонусов. После того как этот кредит будет израсходован, вы все равно сможете использовать Bing Image Creator, но создание изображений будет происходить медленнее и, возможно, менее эффективно. А как насчет получения новых кредитов? Здесь Microsoft действует очень умно. Американская компания полагается на свою Microsoft Rewards - систему поощрений в виде баллов, которые вы получаете, используя поисковую систему Bing и выполняя определенные действия, предложенные ею.

Наконец, поскольку Bing Image Creator предназначен для широкой публики, Microsoft ввела ряд мер предосторожности, чтобы предотвратить использование этого инструмента для создания вредоносного контента. Поэтому на инструмент наложены ограничения, как и на режим "Разговор". Вы не должны нарушать правила, установленные Microsoft, иначе ваша учетная запись очень быстро будет внесена в черный список платформы.

4. Dall-E

Dall-E, модель искусственного интеллекта, на которой основан Bing Image Creator, была разработана компанией OpenAI, создателем ChatGPT. Что касается последней, то можно протестировать возможности Dall-E прямо из веб-браузера. Единственное условие - у вас должен быть аккаунт OpenAI. Если вы уже используете ChatGPT, вы можете использовать свою учетную запись для входа в Dall-E, а если нет, вы можете зарегистрироваться, нажав на ссылку Sign Up, которая отображается под кнопкой входа на странице входа.

К сожалению, в отличие от ChatGPT, который можно использовать бесплатно без ограничений, Dall-E ограничивает количество изображений, которые можно генерировать бесплатно. По умолчанию вы получаете пятнадцать бесплатных кредитов в месяц. Они соответствуют пятнадцати запросам, отправленным инструменту для создания изображений. Если вы хотите использовать Dall-E сверх этого количества кредитов, вам придется заплатить. Получение 115 кредитов стоит около 15 долларов. Бесплатные кредиты, которые вы не используете, нельзя переносить из одного месяца в другой, а те, которые вы покупаете, действительны в течение двенадцати месяцев с момента покупки.

Все изображения, которые вы создаете с помощью Dall-E, сохраняются в истории, доступ к которой вы можете получить без ограничений. Каждый запрос, отправленный в программу, генерирует четыре изображения, которые вы можете загрузить по отдельности.

5. BlueWillowAI

В отличие от других решений, упомянутых выше, BlueWillowAI не является полноценной генеративной моделью искусственного интеллекта. Этот инструмент был создан в январе 2023 года командой инженеров ИИ, которые пока предпочитают оставаться неизвестными. Согласно FAQ на сайте, BlueWillowAI фактически объединяет несколько моделей искусственного интеллекта. Работая таким образом, платформа обещает получить наилучшие возможные результаты в зависимости от введенного запроса. Хотя BlueWillowAI не детализирует модели ИИ, на которые она опирается, она указывает, что использует такие модели, как Stable Diffusion. И, учитывая полученные результаты, есть большая вероятность, что именно эта модель в основном используется инструментом.

BlueWillowAI не имеет специального приложения или веб-сайта. Чтобы воспользоваться инструментом, вам, как и в случае с Midjourney, необходимо создать учетную запись Discord и присоединиться к соответствующему серверу BlueWillowAI. И именно в одном из каналов "новичков", доступных пользователям, вы сможете создавать свои образы. Вам нужно будет воспользоваться командой /imagine, прежде чем войти в подсказку, определяющую детали вашего визуала. После нескольких секунд терпения BlueWillowAI отобразит результат непосредственно в разговоре, которым вы обмениваетесь с другими пользователями, упоминая вас. Это означает, что все созданные вами изображения, как и на Midjourney, будут видны другим пользователям.

Чтобы создать свою подсказку, вы можете воспользоваться пояснениями, которые BlueWillowAI дает в документации, доступной на его сайте. Например, вы можете попросить инструмент использовать существующее изображение, указав после /imagine URL-адрес изображения, затем ваше описание и его параметры (для формата, например).

Каждый запрос, отправленный в BlueWillowAI, генерирует четыре визуальных изображения, которые вы можете затем сохранить на жестком диске. Обратите внимание, что для каждого сгенерированного изображения вы можете выбрать "повысить масштаб" (нажав на Ux, где x - номер изображения, которое нужно повысить) или даже сгенерировать варианты (по тому же принципу, нажав на Vx).

01.04.2023

2 814