10 нейросетей для создания картинок

И как их использовать из России в 2024 году.

10 нейросетей для создания картинок

Мы живём в удивительное время, когда любой может за несколько минут создать картинку с помощью нейросети. Специальные навыки не нужны: в качестве ТЗ подойдёт небольшой текстовый запрос-описание — промпт — или уже готовое изображение.

ИИ — инструмент не только для развлечения, но и мощный помощник для профессиональных дизайнеров. С его помощью создают баннеры, посты для соцсетей, игровых персонажей и даже целые рекламные кампании.

Как выбрать сервис и на что обратить внимание?

В этой статье — плюсы и минусы основных нейросетей для генерации изображений.

Для большей объективности у всех сервисов был один промпт:

A fierce knight rides a huge capybara with a spear in hyperrealism style (Суровый рыцарь скачет с копьем на огромной капибаре в стиле гиперреализм).

Катерина Слободчикова
Креатор

Midjourney

Источник: Midjourney
Источник: Midjourney

Язык: английский, понимает русский

Пробная версия: до 25 картинок

Платный тариф: от $10/месяц

Midjourney — один из самых популярных сервисов, который умеет генерировать реалистичные картинки по текстовому запросу. Раньше MJ была полностью платной, но сейчас у новых пользователей есть возможность «потестить» сервис и создать 25 изображений.

Нейросеть отлично справляется с редактированием как целых, так и небольших участков картинки, увеличивает разрешение, соединяет воедино несколько изображений, позволяет посмотреть результаты генераций и промпты других пользователей. А ещё по той же подписке можно использовать дочернюю нейросеть Niji Journey, которая генерирует изображения в аниме-стиле.

Плюсы:

  • Работает в России без VPN, через мессенджер Discord или сайт.
  • Генерирует изображения с лучшим фотореализмом на рынке.
  • Использует разнообразные стили и композиции, есть дополнительные инструменты (например, повторить персонажа с картинки-референса или стиль).

Минусы:

  • Оплата из РФ возможна только через кошелёк Apple ID, пополненный по номеру телефона (не для всех операторов).
  • Результат будет лучше, если промпт написан на английском языке.

Dall-E 3

Источник: Dall-e 3
Источник: Dall-e 3

Язык: английский, понимает русский

Пробная версия: 2 картинки

Платный тариф: от $20/месяц

Сервис от OpenAI, создателя ChatGPT. Там же — в ChatGPT — проходит «общение» с Dall-E.

Нейросеть понимает естественную речь: в отличие от Midjourney здесь не нужно продумывать каждое слово в промпте. Достаточно лишь приблизительно описать желаемый результат, а ИИ при необходимости самостоятельно доработает изображение.

Нейросеть понимает промты с достаточно сложными концепциями и большим количеством разноплановых героев. Различает абстрактные запросы. Например, по запросу «‎сделай цвета мягче» сразу приглушает яркость. Как и Midjourney, позволяет редактировать выбранные участки изображения и добавлять на картинки текст. Также Dall-E по умолчанию скрывает результаты генераций из общей ленты: это удобно, если ваши задачи связаны с коммерческой тайной или вам просто не хочется делиться своими промптами.

Бесплатные генерации доступны только на сайте или через расширение Bing Creator (с учётной записью Microsoft). Детализация изображений в бесплатной версии также хуже.

В целом у Dall-E не такое большое разнообразие композиций, как у Midjourney: чтобы получить что-то интересное, нужно потратить очень много попыток генераций. Например, на натюрмортах в 90% случаев нейросеть выстраивает предметы симметрично и по центру. Количество стилей также ограничено, не всегда получается сымитировать изображение в стиле известного художника. К примеру, картинку в стиле Сальвадора Дали создать получилось, но в стиле Малевича — нет (нейросеть посчитала это нарушением авторских прав).

Загрузить картинку-референс и перенести на неё стиль или персонажа (как в Midjourney) не получится: все команды придётся прописывать вручную.

В часы высокой нагрузки на серверы Dall-E (примерно 17:00–19:00 мск) можно упереться в лимит по генерациям — нейросеть не будет принимать новые запросы несколько часов.

Кроме того, у Dall-E довольно жёсткая цензура: нейросеть не позволяет генерировать картинки, хоть сколько-нибудь связанные с насилием (даже, например, кости), а также изображения с историческими личностями и ныне живущими знаменитостями.

Плюсы:

  • Работает через чат на сайте или по API в любом удобном интерфейсе.
  • Понимает команды на русском.

Минусы:

  • Работает только с VPN.
  • Не позволяет платить российскими картами.

Leonardo AI

Источник: Leonardo AI
Источник: Leonardo AI

Язык: английский, понимает русский

Доступна бесплатно

Платный тариф: от $12/месяц

ИИ способен генерировать реалистичные изображения, эскизы, концептуальные рисунки и логотипы.

У пользователей есть бесплатный доступ к 10 моделям и 21 стилю. Интерфейс простой и понятный, готовые изображения можно редактировать с помощью разнообразных инструментов.

Нейросеть не требует больших мощностей, что делает её подходящей как профессионалам, так и новичкам.

Сейчас Leonardo доступен в браузерной и IOS версиях.

Плюсы:

  • Бесплатный доступ.
  • Реалистичность изображений при включении стиля в промпт.
  • Работает без VPN и иностранных сим-карт.
  • Понимает русский язык.

Минусы:

  • Оплата российскими картами недоступна — нужна зарубежная карточка или сервисы-посредники. Например, Remoney, GetPayAll, i2pay.

Gemini

Источник: Gemini
Источник: Gemini

Язык: английский, понимает русский

Доступна бесплатно

Нейросеть от Google, которая тоже генерирует картинки без строгих правил составления промптов.

По качеству проработки и детализации изображения от Gemini в целом уступают генерациям Midjourney и Dall-E. Как и последняя, по умолчанию центрирует предметы и располагает их симметрично.

Когда промт длинный или сложный, учитывает лишь первые несколько пунктов. Например, в нашем ИИ приняла только краткое описание героя (рыцарь) и дополнительный объект (капибара), а требования к фону или цвету брони наездника проигнорировала.

Кроме того, Gemini отказывается генерировать изображения людей с видимыми участками кожи. Разработчикам пришлось отключить эту возможность из-за расовой предвзятости нейросети. Например, в нашем случае нейросеть отказывалась изображать рыцаря без шлема.

Плюсы:

  • Работает бесплатно.
  • Генерирует быстрее Midjourney и Dall-E — буквально за 10 секунд.
  • Понимает команды на русском языке, не нужно учить названия инструментов или специальные команды.

Минусы:

  • Сервис официально недоступен в России, нужен VPN.
  • Иногда отказывается генерировать изображение без причины (чего не случается у конкурентов).
  • Пока генерирует только квадратные изображения.

Ideogram

Источник: Ideogram
Источник: Ideogram

Язык: английский, понимает русский

Бесплатно: до 40 картинок в день

Платный тариф: от $8/месяц

Сервис от бывших руководителей проектов по созданию ИИ в Google Brain.

Ideogram хорошо понимает сюрреалистические промпты. Например, вы попросите нейросеть: «Нарисуй существо, похожее на улитку, которое играет на скрипке». Midjourney в этом случае, скорее всего, нарисует некое антропоморфное существо (потому что играть на скрипке может только человек), но у Ideogram такой когнитивной рамки не будет.

Отлично генерирует изображения с текстом, в том числе с леттерингом или логотипами. Также неплохо имитирует фотореализм, особенно если задать освещение, модель фотоаппарата или плёнку, а также имя режиссёра или период съёмки.

Ideogram слабо детализирует средний и дальний план и не понимает сложные промпты. Пальцы, глаза, складки на одежде изображает скорее неестественно: в картинках легко распознать авторство нейросети.

Плюсы:

  • Работает в России без VPN.
  • Генерирует быстрее Midjourney и Dall-E.
  • Открывает результаты генераций и промты других пользователей.
  • Позволяет генерировать изображения с персонажами поп-культуры.

Минусы:

  • Генерирует бесплатно только 40 изображений в день, некоторые функции под пейволлом.
  • Бесплатные генерации менее качественные.
  • Нейросеть хоть и понимает русский, но промты на этом языке выполняет в произвольном порядке.
  • По умолчанию центрирует предметы и располагает их симметрично.

Если создания картинок недостаточно, попробуйте сгенерировать видео:

Firefly

Источник: Firefly
Источник: Firefly

Язык: английский, понимает русский

Бесплатно: 25 генеративных кредитов в месяц

Платный тариф: от $4,99/месяц за 100 генеративных кредитов

Сервис от Adobe, который лучше использовать с пакетом фирменных программ, чтобы получить больше возможностей. Например, в Adobe Illustrator можно генерировать векторную графику, а в Adobe Express — придавать визуальные эффекты тексту. Помимо прочего, ИИ умеет убирать с изображения ненужные объекты — так работает функция генеративной заливки.

Firefly позволяет расширять фон изображения по заданным параметрам и хорошо имитирует фотореализм.

Как и Dall-E, не рисует голую кожу даже на руках.

Плюсы:

  • Понимает промпты на русском.
  • Показывает генерации других пользователей.
  • Не страдает «центризмом», как Dall-E или Ideogram.
  • Редактирует части изображений.

Минусы:

  • Генерирует бесплатно только 25 изображений в месяц.
  • Работает только с VPN, которые выдают личные IP-адреса (чтобы другой человек не мог с него же зарегистрироваться).

DreamStudio от Stability.ai

Источник: DreamStudio
Источник: DreamStudio

Язык: английский, понимает русский

На старте — 25 генеративных кредитов (около 100 картинок)

Кредиты можно докупать: за $1 сервис начислит 100 кредитов. Их хватит примерно на 500 картинок.

ИИ генерирует изображения на основе фотографии или текстового описания на английском языке. Сервис поддерживает промпты на русском, но в таком случае пострадает точность результата.

Пользователь может выбирать стиль картинки, задавать пропорции и указывать количество изображений, которое получится в результате одного запроса.

Плюсы:

  • Доступна бесплатно.
  • Можно докупать необходимое количество кредитов.
  • Много возможностей кастомизировать изображение.
  • Быстрая генерация.

Минусы:

  • Проблемы с пониманием русского языка.

Craiyon

Источник: Craiyon
Источник: Craiyon

Язык: английский

Доступна бесплатно

Платный тариф: от $10/месяц

Craiyon не умеет создавать изображения по картинке-референсу — пользователю доступны только текстовые запросы.

На старте можно выбрать один из трёх стилей: Art, Drawing или Photo. Также есть опция None, с ней результат будет без привязки к какому-либо стилю. Для исключения из результата нежелательных элементов возможно указать негативный промпт, где необходимо перечислить всё, чего не должно быть на картинке.

По окончании генерации доступно 9 вариантов на выбор размером 256×256 пикселей. Выбранное изображение можно улучшить с помощью Upscale до разрешения 1024×1024 пикселя.

Готовая картинка будет с водяным знаком, убрать который можно после оплаты пакета.

Плюсы:

  • Доступна бесплатно.
  • Понятный и простой интерфейс.

Минусы:

  • Реклама и водяные знаки в бесплатной версии.
  • Понимает только английский язык.
  • Качество готовых картинок оставляет желать лучшего.

«‎Шедеврум»

Источник: «Шедеврум»
Источник: «Шедеврум»

Язык: русский, английский

Доступна бесплатно

Приложение от «Яндекса» на основе нейросетей YandexGPT и YandexART.

«Шедеврум» не только показывает генерации других пользователей — по сути, она представляет собой соцсеть. Там можно развивать свой блог с генерациями.

Нейросеть генерирует изображения в разных стилях и жанрах: ретро, винтаж, абстракции, графика, фэнтези, пейзаж, портрет и т. д.

Из двух генераций по одному промту «Шедеврум» позволяет сохранить только один результат.

В целом нейросеть слабо имитирует фотореализм, изображает глаза и складки на одежде неестественно (по результату легко понять, что это нейросетевая картинка).

Кроме того, «Шедеврум» запрещает упоминать в промтах фамилии и названия брендов, не генерирует изображения с религиозной атрибутикой или политической символикой. У неё в целом много ограничений, при этом они не всегда очевидны. Например, нейросеть иногда пропускает запросы с фамилиями актёров, но с фамилиями политиков запросы не выполняет.

Плюсы:

  • Бесплатная.
  • Работает без VPN.
  • Понимает русский, английский и казахский.

Минусы:

  • Генерирует изображения только в мобильном приложении.
  • Плохо детализирует картинки.
  • Иногда отказывается выполнять промпты без видимых причин.

Kandinsky

Источник: Kandinsky
Источник: Kandinsky

Язык: русский, английский

Доступна бесплатно

Сервис от «Сбера», который по реалистичности и детализации изображений сравнивают с Midjourney. ИИ создаёт картинки по промптам и изображениям, умеет миксовать их и предлагает на выбор 17 стилей.

Кстати, стили и инструменты обработки в Kandinsky заданы словами, что удобнее, чем, к примеру, вызывать те же команды специальными словами в Midjourney. Помимо этого и в ботах, и в приложении сохраняется вся история ваших генераций (на сайте — нет).

Плюсы:

  • Работает бесплатно.
  • Позволяет генерировать изображения на сайте, в телеграм- или VK-боте, приложении «Сбера» и через ассистентов «Салют» на «умной» технике.
  • Понимает более 100 языков, но основной фокус — на русском и английском.

Минусы:

  • Не позволяет посмотреть промпты других пользователей.
  • Не всегда понимает сложные запросы с большим количеством персонажей и элементов.
  • Не понимает «отрицательные» промпты, написанные с частицей «не» или словом «нет».
  • Пальцы, глаза, складки на одежде выдают авторство нейросети.
  • Kandinsky запрещает генерировать изображения, связанные с насилием, обнажёнкой, политикой, в том числе госсимволикой.

А если нужно просто улучшить уже существующее фото, посмотрите эту подборку из 9 сервисов:

Что в итоге

При выборе нейросети для генерации изображений стоит исходить не только из доступности сервиса в России, но и результата, который хотите получить. Пока с изображениями человеческих рук и глаз российские ИИ справляются не очень, поэтому поэтому «Шедеврум» и Kandinsky лучше использовать для пейзажей или натюрмортов.

Если нужен фотореализм, стоит заморочиться с доступами к зарубежным сервисам, например, Midjourney или Firefly. Для сюрреалистичных промптов подойдёт Ideogram. С Dall-E стоит работать, если ваша работа связана с коммерческой тайной и не попадает на пик серверных нагрузок.

Поделитесь в комментариях, какими нейросетями для создания изображений пользуетесь вы и почему?

44
11
Начать дискуссию