10 нейросетей для генерации изображений

И как их использовать из России в 2024 году.

Мы живём в удивительное время, когда любой может за несколько минут создать картинку с помощью нейросети. Специальные навыки не нужны: в качестве ТЗ подойдёт небольшой текстовый запрос-описание — промпт — или уже готовое изображение.

ИИ — инструмент не только для развлечения, но и мощный помощник для профессиональных дизайнеров. С его помощью создают баннеры, посты для соцсетей, игровых персонажей и даже целые рекламные кампании.

Как выбрать сервис и на что обратить внимание?

В этой статье — плюсы и минусы основных нейросетей для генерации изображений.

Midjourney
Dall-E 3
Leonardo AI
Gemini
Ideogram
Firefly
DreamStudio
Craiyon
«Шедеврум»
Kandinsky
Итоги

Для большей объективности у всех сервисов был один промпт:

A fierce knight rides a huge capybara with a spear in hyperrealism style (Суровый рыцарь скачет с копьем на огромной капибаре в стиле гиперреализм).

Язык: английский, понимает русский
Пробная версия: до 25 картинок
Платный тариф: от $10/месяц

Попробовать

Midjourney — один из самых популярных сервисов, который умеет генерировать реалистичные картинки по текстовому запросу. Раньше MJ была полностью платной, но сейчас у новых пользователей есть возможность «потестить» сервис и создать 25 изображений.

Нейросеть отлично справляется с редактированием как целых, так и небольших участков картинки, увеличивает разрешение, соединяет воедино несколько изображений, позволяет посмотреть результаты генераций и промпты других пользователей. А ещё по той же подписке можно использовать дочернюю нейросеть Niji Journey, которая генерирует изображения в аниме-стиле.

Плюсы:

Работает в России без VPN, через мессенджер Discord или сайт.
Генерирует изображения с лучшим фотореализмом на рынке.
Использует разнообразные стили и композиции, есть дополнительные инструменты (например, повторить персонажа с картинки-референса или стиль).

Минусы:

Оплата из РФ возможна только через кошелёк Apple ID, пополненный по номеру телефона (не для всех операторов).
Результат будет лучше, если промпт написан на английском языке.

Подробный гайд по MJ

Язык: английский, понимает русский
Пробная версия: 2 картинки
Платный тариф: от $20/месяц

Попробовать

Сервис от OpenAI, создателя ChatGPT. Там же — в ChatGPT — проходит «общение» с Dall-E.

Нейросеть понимает естественную речь: в отличие от Midjourney здесь не нужно продумывать каждое слово в промпте. Достаточно лишь приблизительно описать желаемый результат, а ИИ при необходимости самостоятельно доработает изображение.

Нейросеть понимает промты с достаточно сложными концепциями и большим количеством разноплановых героев. Различает абстрактные запросы. Например, по запросу «‎сделай цвета мягче» сразу приглушает яркость. Как и Midjourney, позволяет редактировать выбранные участки изображения и добавлять на картинки текст. Также Dall-E по умолчанию скрывает результаты генераций из общей ленты: это удобно, если ваши задачи связаны с коммерческой тайной или вам просто не хочется делиться своими промптами.

Бесплатные генерации доступны только на сайте или через расширение Bing Creator (с учётной записью Microsoft). Детализация изображений в бесплатной версии также хуже.

В целом у Dall-E не такое большое разнообразие композиций, как у Midjourney: чтобы получить что-то интересное, нужно потратить очень много попыток генераций. Например, на натюрмортах в 90% случаев нейросеть выстраивает предметы симметрично и по центру. Количество стилей также ограничено, не всегда получается сымитировать изображение в стиле известного художника. К примеру, картинку в стиле Сальвадора Дали создать получилось, но в стиле Малевича — нет (нейросеть посчитала это нарушением авторских прав).

Загрузить картинку-референс и перенести на неё стиль или персонажа (как в Midjourney) не получится: все команды придётся прописывать вручную.

В часы высокой нагрузки на серверы Dall-E (примерно 17:00–19:00 мск) можно упереться в лимит по генерациям — нейросеть не будет принимать новые запросы несколько часов.

Кроме того, у Dall-E довольно жёсткая цензура: нейросеть не позволяет генерировать картинки, хоть сколько-нибудь связанные с насилием (даже, например, кости), а также изображения с историческими личностями и ныне живущими знаменитостями.

Плюсы:

Работает через чат на сайте или по API в любом удобном интерфейсе.
Понимает команды на русском.

Минусы:

Работает только с VPN.
Не позволяет платить российскими картами.

Язык: английский, понимает русский
Доступна бесплатно
Платный тариф: от $12/месяц

Попробовать

ИИ способен генерировать реалистичные изображения, эскизы, концептуальные рисунки и логотипы.

У пользователей есть бесплатный доступ к 10 моделям и 21 стилю. Интерфейс простой и понятный, готовые изображения можно редактировать с помощью разнообразных инструментов.

Нейросеть не требует больших мощностей, что делает её подходящей как профессионалам, так и новичкам.

Сейчас Leonardo доступен в браузерной и IOS версиях.

Плюсы:

Бесплатный доступ.
Реалистичность изображений при включении стиля в промпт.
Работает без VPN и иностранных сим-карт.
Понимает русский язык.

Минусы:

Оплата российскими картами недоступна — нужна зарубежная карточка или сервисы-посредники. Например, Remoney, GetPayAll, i2pay.

Подробный гайд по Leonardo AI

Язык: английский, понимает русский
Доступна бесплатно

Попробовать

Нейросеть от Google, которая тоже генерирует картинки без строгих правил составления промптов.

По качеству проработки и детализации изображения от Gemini в целом уступают генерациям Midjourney и Dall-E. Как и последняя, по умолчанию центрирует предметы и располагает их симметрично.

Когда промт длинный или сложный, учитывает лишь первые несколько пунктов. Например, в нашем ИИ приняла только краткое описание героя (рыцарь) и дополнительный объект (капибара), а требования к фону или цвету брони наездника проигнорировала.

Кроме того, Gemini отказывается генерировать изображения людей с видимыми участками кожи. Разработчикам пришлось отключить эту возможность из-за расовой предвзятости нейросети. Например, в нашем случае нейросеть отказывалась изображать рыцаря без шлема.

Плюсы:

Работает бесплатно.
Генерирует быстрее Midjourney и Dall-E — буквально за 10 секунд.
Понимает команды на русском языке, не нужно учить названия инструментов или специальные команды.

Минусы:

Сервис официально недоступен в России, нужен VPN.
Иногда отказывается генерировать изображение без причины (чего не случается у конкурентов).
Пока генерирует только квадратные изображения.

Язык: английский, понимает русский
Бесплатно: до 40 картинок в день
Платный тариф: от $8/месяц

Попробовать

Сервис от бывших руководителей проектов по созданию ИИ в Google Brain.

Ideogram хорошо понимает сюрреалистические промпты. Например, вы попросите нейросеть: «Нарисуй существо, похожее на улитку, которое играет на скрипке». Midjourney в этом случае, скорее всего, нарисует некое антропоморфное существо (потому что играть на скрипке может только человек), но у Ideogram такой когнитивной рамки не будет.

Отлично генерирует изображения с текстом, в том числе с леттерингом или логотипами. Также неплохо имитирует фотореализм, особенно если задать освещение, модель фотоаппарата или плёнку, а также имя режиссёра или период съёмки.

Ideogram слабо детализирует средний и дальний план и не понимает сложные промпты. Пальцы, глаза, складки на одежде изображает скорее неестественно: в картинках легко распознать авторство нейросети.

Плюсы:

Работает в России без VPN.
Генерирует быстрее Midjourney и Dall-E.
Открывает результаты генераций и промты других пользователей.
Позволяет генерировать изображения с персонажами поп-культуры.

Минусы:

Генерирует бесплатно только 40 изображений в день, некоторые функции под пейволлом.
Бесплатные генерации менее качественные.
Нейросеть хоть и понимает русский, но промты на этом языке выполняет в произвольном порядке.
По умолчанию центрирует предметы и располагает их симметрично.

Если создания картинок недостаточно, попробуйте сгенерировать видео:

Валерия Ильина

16.08.2024

Runway Gen-3 Alpha создаст реалистичное видео с монстром и оживит любую фантазию

Что умеет нейросеть, которую обучали профессионалы киноиндустрии.

Язык: английский, понимает русский
Бесплатно: 25 генеративных кредитов в месяц
Платный тариф: от $4,99/месяц за 100 генеративных кредитов

Попробовать

Сервис от Adobe, который лучше использовать с пакетом фирменных программ, чтобы получить больше возможностей. Например, в Adobe Illustrator можно генерировать векторную графику, а в Adobe Express — придавать визуальные эффекты тексту. Помимо прочего, ИИ умеет убирать с изображения ненужные объекты — так работает функция генеративной заливки.

Firefly позволяет расширять фон изображения по заданным параметрам и хорошо имитирует фотореализм.

Как и Dall-E, не рисует голую кожу даже на руках.

Плюсы:

Понимает промпты на русском.
Показывает генерации других пользователей.
Не страдает «центризмом», как Dall-E или Ideogram.
Редактирует части изображений.

Минусы:

Генерирует бесплатно только 25 изображений в месяц.
Работает только с VPN, которые выдают личные IP-адреса (чтобы другой человек не мог с него же зарегистрироваться).

Язык: английский, понимает русский
На старте — 25 генеративных кредитов (около 100 картинок)
Кредиты можно докупать: за $1 сервис начислит 100 кредитов. Их хватит примерно на 500 картинок.

Попробовать

ИИ генерирует изображения на основе фотографии или текстового описания на английском языке. Сервис поддерживает промпты на русском, но в таком случае пострадает точность результата.

Пользователь может выбирать стиль картинки, задавать пропорции и указывать количество изображений, которое получится в результате одного запроса.

Плюсы:

Доступна бесплатно.
Можно докупать необходимое количество кредитов.
Много возможностей кастомизировать изображение.
Быстрая генерация.

Минусы:

Проблемы с пониманием русского языка.

Язык: английский
Доступна бесплатно
Платный тариф: от $10/месяц

Попробовать

Craiyon не умеет создавать изображения по картинке-референсу — пользователю доступны только текстовые запросы.

На старте можно выбрать один из трёх стилей: Art, Drawing или Photo. Также есть опция None, с ней результат будет без привязки к какому-либо стилю. Для исключения из результата нежелательных элементов возможно указать негативный промпт, где необходимо перечислить всё, чего не должно быть на картинке.

По окончании генерации доступно 9 вариантов на выбор размером 256×256 пикселей. Выбранное изображение можно улучшить с помощью Upscale до разрешения 1024×1024 пикселя.

Готовая картинка будет с водяным знаком, убрать который можно после оплаты пакета.

Плюсы:

Доступна бесплатно.
Понятный и простой интерфейс.

Минусы:

Реклама и водяные знаки в бесплатной версии.
Понимает только английский язык.
Качество готовых картинок оставляет желать лучшего.

Язык: русский, английский
Доступна бесплатно

Попробовать

Приложение от «Яндекса» на основе нейросетей YandexGPT и YandexART.

«Шедеврум» не только показывает генерации других пользователей — по сути, она представляет собой соцсеть. Там можно развивать свой блог с генерациями.

Нейросеть генерирует изображения в разных стилях и жанрах: ретро, винтаж, абстракции, графика, фэнтези, пейзаж, портрет и т. д.

Из двух генераций по одному промту «Шедеврум» позволяет сохранить только один результат.

В целом нейросеть слабо имитирует фотореализм, изображает глаза и складки на одежде неестественно (по результату легко понять, что это нейросетевая картинка).

Кроме того, «Шедеврум» запрещает упоминать в промтах фамилии и названия брендов, не генерирует изображения с религиозной атрибутикой или политической символикой. У неё в целом много ограничений, при этом они не всегда очевидны. Например, нейросеть иногда пропускает запросы с фамилиями актёров, но с фамилиями политиков запросы не выполняет.

Плюсы:

Бесплатная.
Работает без VPN.
Понимает русский, английский и казахский.

Минусы:

Генерирует изображения только в мобильном приложении.
Плохо детализирует картинки.
Иногда отказывается выполнять промпты без видимых причин.

Подробный гайд по «Шедевруму»

Язык: русский, английский
Доступна бесплатно

Попробовать

Сервис от «Сбера», который по реалистичности и детализации изображений сравнивают с Midjourney. ИИ создаёт картинки по промптам и изображениям, умеет миксовать их и предлагает на выбор 17 стилей.

Кстати, стили и инструменты обработки в Kandinsky заданы словами, что удобнее, чем, к примеру, вызывать те же команды специальными словами в Midjourney. Помимо этого и в ботах, и в приложении сохраняется вся история ваших генераций (на сайте — нет).

Плюсы:

Работает бесплатно.
Позволяет генерировать изображения на сайте, в телеграм- или VK-боте, приложении «Сбера» и через ассистентов «Салют» на «умной» технике.
Понимает более 100 языков, но основной фокус — на русском и английском.

Минусы:

Не позволяет посмотреть промпты других пользователей.
Не всегда понимает сложные запросы с большим количеством персонажей и элементов.
Не понимает «отрицательные» промпты, написанные с частицей «не» или словом «нет».
Пальцы, глаза, складки на одежде выдают авторство нейросети.
Kandinsky запрещает генерировать изображения, связанные с насилием, обнажёнкой, политикой, в том числе госсимволикой.

Подробный гайд по Kandinsky

А если нужно просто улучшить уже существующее фото, посмотрите эту подборку из 9 сервисов:

Валерия Ильина

Сервисы

29.08.2024

Нейросети для улучшения качества фото: 9 простых сервисов

Чтобы увеличить изображение, убрать шум и размытость картинки.

При выборе нейросети для генерации изображений стоит исходить не только из доступности сервиса в России, но и результата, который хотите получить. Пока с изображениями человеческих рук и глаз российские ИИ справляются не очень, поэтому поэтому «Шедеврум» и Kandinsky лучше использовать для пейзажей или натюрмортов.

Если нужен фотореализм, стоит заморочиться с доступами к зарубежным сервисам, например, Midjourney или Firefly. Для сюрреалистичных промптов подойдёт Ideogram. С Dall-E стоит работать, если ваша работа связана с коммерческой тайной и не попадает на пик серверных нагрузок.

Валерия Ильина

30.07.2024

30 нейросетей, которые упростят вашу жизнь

Крутые ИИ-помощники для творческих, рутинных задач и веселья.

10 нейросетей для создания картинок

Midjourney

Dall-E 3

Leonardo AI

Gemini

Ideogram

Firefly

DreamStudio от Stability.ai

Craiyon

«‎Шедеврум»

Kandinsky

Что в итоге

Поделитесь в комментариях, какими нейросетями для создания изображений пользуетесь вы и почему?