В этой статье мы рассмотрим сравнение ИИ (нейросетей) для генерации изображений: Stable Diffusion, Midjourney и Dalle-3. Сравним аналоги и разберемся, какая нейросеть лучше подходит для тех или иных задач, ведь у каждой из них есть свои уникальные особенности. Аналоги Midjourney, Dalle, Stable Diffusion. Сравнение нейросетейСравнение разных ии для генерации изображенийЯ пользуюсь разными нейронными сетями для работы с текстом, изображениями, видео, аудио… Протестировал несколько сервисов и остановился на телеграмм боте, в котором есть возможность взаимодействовать с самыми популярными нейронками.Начнём с самой простой (по моему мнению) нейросети для создания изображений — "DALLE — 3"Основные характеристики и возможности Далли — 3Dalle редко создает изображения рук людей, на которых присутствует больше пяти пальцев (эта проблема, характерная для других нейронных сетей, была успешно решена)Почти нет вероятности возникновения дополнительных конечностей в процессе генерацииДалли обладает способностью встраивать текст на изображения, соответствующий контексту (на данный момент поддерживается только английский язык)Имеет обширные знания о множестве персонажей, которые не доступны в других нейросетяхЗапросы можно писать простым языком без использования сложных терминов или дополнительных параметровФункция автодополнения промптов, которая облегчает задачу для начинающих пользователейВозможность скрещивать разных персонажей и предметов в одном изображенииКак пользоваться нейросетью DALLE 3 на русском языке онлайн в боте TelegramЧтобы бесплатно создать изображение в Далли, заходим в телеграм бота (без регистрации) и в меню нажимаем «DALLE-3» в режиме «Multi-image»На данный момент меню бота выглядит немного по-другому, если возникнут трудности, напишите мне в лс.Меню бота в тгСравним сгенерированные изображения в разных нейросетях по запросам с человеком и мультяшных персонажем.промпт 1: "Дональд Дак держит в руках золотую монету"промпт 2: "Девушка сидит на траве на фоне гор"Применение стилей в DALLE — 3Давайте рассмотрим несколько вариантов создания изображения с помощью dalle в различных стилях, используя тот же самый промпт. Для этого перейдем на вкладку «Стили»Стили для Dalle - 3Я выбрал следующие стили для данного изображения: "Steampunk", "Logo", "Horror", "Space", "NeonPunk"Для фотографии с девушкой применим другие стили: "Anime2, "Gothic", "ComicBook", "Futuristic", "Fashion"Нейронная сеть успешно справилась с поставленной задачей и создала изображения в соответствии с выбранными стилями. Совмещение персонажей в DALLE — 3Промпт: "Комбинация дональда дака и стрекозы"Как я и говорил, Далли неплохо «скрещивает» персонажей, а так же людей, различные предметы...Как написать текст на изображениях в Dalle-3На данный момент вставить текст на картинках можно только на английском языке.Промпт: "Дональд дак держит золотую монету в руке с надписью "Rich"Текст на картинке с помощью ИИНе всегда с первого раза получается нужный результат, иногда следует повторить генерацию.Так же в боте доступны расширенные функции для Далли. Об этом я подробно описывал в данной статьеСравнение midjourney с другими нейросетями для генерации изображенийРассмотрим аналог dalle. Одну из самых популярных нейронных сетей: "Midjourney"В основном использование миджорни доступно через Discord. Однако для многих пользователей это не удобно из-за определённых минусов, например, ограничение в приеме платежей с некоторых карт, подключение VPN и пр.Подобных проблем нет при работе с нейросетью через бота в мессенджере Telegram. Доступна последняя версия midjourney v. 6 со всеми основными функциями и расширенными возможностями.Как пользоваться нейросетью миджорни онлайн в телеграм боте на русском языкеВ меню бота выбираем нейросеть "midjourney" и можем так же отправлять запросы для получения генераций, использовать стили, применять настройки и дополнительные опции.Миджорни в телеграм ботеПроведём сравнение midjourney с другими нейросетями для генерации изображенийСоздадим картинки в миджрони с таким же запросом, который писали в далли.Промпт 1: "Дональд Дак держит в руках золотую монету"промпт 2: "Девушка сидит на траве на фоне гор"Так же в этой нейросети можем применять различные стили (более 40). Заходим во вкладку «Стили» и, для сравнения, выберем такие же, которые использовали в dalle.Как мы видим, на изображениях появились характерные черты от миджорни.Как написать текст на изображениях в midjourneyДанная нейронка также умеет встраивать текст на картинках.Пишем аналогичный промпт: "Дональд дак держит золотую монету в руке с надписью "Rich"Миджорни рисует текст на картинкахА вот что у меня получилось при скрещивании персонажей)С этой задачей Далли справилась получше.Промпт: "Комбинация дональда дака и стрекозы"Так же в Миджорни есть множество дополнительных функций, настроек, определённых команд. Возможность сделать вариации персонажа, дорисовать окружение, увеличить размер изображения с переработкой деталей и пр.На данном этапе углубляться в расширенные опции не будем, всё таки это тема для отдельной статьи.Самое интересное, что в боте нейросети могут взаимодействовать между собойПосле создания изображения в миджорни и далли мы можем воспользоваться функцией «Inpaint» от «Stable Diffusion» и дополнительно отредактировать картинку: удалить ненужный объект, заменить фон, перерисовать определённую деталь, вставить другое лицо на фото и пр.Дополнительные функции в миджорниНа эту тему есть отдельная статья, рекомендую ознакомиться.Рассмотрим следующий аналог — "Stable Diffusion"Как пользоваться нейросетью Stable Diffusion онлайн на русском языке в телеграм ботеПереключаемся в меню бота на следующую нейросеть и сравним генерации изображений с далли и миджорни.Меню бота с нейросетямиОтправляем такие же запросы: "Дональд Дак держит в руках золотую монету" и "Девушка сидит на траве на фоне гор"Посмотрим как это нейросеть рисует в других стилях, которые мы применяли ранее.Таким образом мы можем отправить один промт в разные нейронки на одной платформе, сравнить результат ИИ и выбрать тот, который нас больше устроит.Stable Diffusion с написанием текста на данный момент изображения не генерирует, а вот со скрещиванием персонажей справляется.Для этого нам нужно прописать следующим промпт: [дональд дак:стрекоза:0.5] таким образом нейросеть будет рисовать сначала первого персонажа на 50% затем дорисовывать второго.В нейросети «Stable Diffusion» существует множество преимуществ: выбор моделей, сэмплеров, размер картинок, конструктор изображений, возможность заменять лицо на фото, использование функции «LoRa» и многое другое.Вот подробная инструкция по генерации картинок в «Stable Diffusion».Так же есть статья по созданию изображения с любым лицом и замене лица на фото с помощью «Stable Diffusion»В данном боте есть возможность бесплатно протестировать некоторые функции, так как каждый лень начисляется несколько баллов для генераций.Если вам интересна тема нейросетей, рекомендую начать проходить пошаговое обучение и применять полученные навыки для решения определённых задач в вашей сфере деятельности.
Ну midjourney самые приятные картинги генерит.
Каждая нейросеть имеет свои преимущества, и здорово видеть, как они справляются с различными задачами, хоть это иногда и пугает, так как развиваются они конечно, со скоростью света
Отличный обзор и навигация по нейросетям 👍
нейронки развиваются, занятно наблюдать за этим. спасибо за обзор
почему утри с крыльями стрекозы так реалистично смотрятся? Нейросети конечно показывают нам ,что нет пределов в воплощении идеи-это очень круто
sd без ограничений и меньшая зависимость от "дяди". Просто научиться пользоваться.
Любимо💞🌞💞