Emu от Meta VS Midjourney 5.2: какой ИИ-генератор изображений лучше?
Сфера искусственного интеллекта для генерации изображений в настоящее время находится на подъеме. Недавно Adobe выпустила вторую итерацию Firefly, OpenAI запустил Dall-E 3 с интеграцией ChatGPT, а Midjourney представила 4-кратное увеличение масштаба своих изображений.
Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.
2 ноября компания Meta* AI присоединилась к генерации изображений, анонсировав свою собственную ИИ-модель изображений под названием Emu.
Я заметил, что первые результаты работы Emu, выпущенные компанией Meta, вполне сопоставимы с результатами работы Midjourney 5.2. Поэтому в этой статье я сравню изображения, полученные с помощью Emu и Midjourney, используя аналогичные промпты.Давайте начнем.
Промпт: an afrofuturist lady wearing gold jewelry
Обе модели ИИ способны генерировать очень сложные и высокодетализированные изображения. Теперь все сводится к личным предпочтениям. Для меня более предпочтительным является изображение справа, созданное Emu.
Промпт: a playful kitten amusing itself with a yarn in a room bathed in sunlight
Обе кошки выглядят очаровательно! Но мне кажется, что та, что справа, выглядит более реалистично.
Промпт: a cool orange cat wearing sunglasses playing a guitar with a group of dancing bananas
Midjourney не удалось создать целостный образ для этого промпта. Персонажи на заднем плане - не бананы. Так что по связности здесь победил Emu.
Промпт: a horse reading a book
Опять же, оба изображения впечатляют. Лично мне больше нравится причудливый стиль изображения Midjourney.
Промпт: a painting of an adorable rabbit sitting on a colorful splash
На изображении Midjourney кролик, похоже, не сидит на брызгах, поэтому в этом раунде по согласованности победил Emu. Но оба этих изображения выглядят креативно.
Промпт: a light bulb containing a sailboat floats through the galaxy
Для данного промпта ни одна из моделей ИИ не оправдала ожиданий. Я не вижу ни парусника внутри лампочки, ни образов, плавающих в галактике. Однако Emu оказался ближе.
Промпт: eerie man, but not genuinely frightening
Оба выглядят жутковато, но изображение Emu справа менее пугающее, чем указанное. Изображение Midjourney напоминает персонажа фильма ужасов.
Промпт: an emu wearing sunglasses and chilling on a beach
Мне нравятся оба этих фантазийных изображения эму! Какое из них вам больше нравится?
Промпт: a woman on a bed underneath a blanket
Опять же, изображение Emu справа выглядит более естественно и реалистично. Midjourney иногда слишком сильно стилизует результаты.
В целом, Emu создал изображения более убедительные и последовательные, чем Midjourney 5.2. В течение долгого времени я был поклонником Midjourney, но Emu, судя по этим результатам, является очень близким, а иногда и лучшим конкурентом.
Emu демонстрирует сочетание возможностей когерентности Dall-E и эстетики Midjourney. Но важно отметить, что компания Meta до сих пор не выпустила специализированный сайт для генерации AI-изображений с помощью Emu. Это означает, что изображения, которые я использовал в этой статье для Emu, были предварительно отобраны авторами исследовательской работы.
Я надеюсь, что эта статья была вам полезна, и если вам интересно посмотреть, как Emu сравнивается с Dall-E 3 или Adobe Firefly 2.0, пожалуйста, напишите мне об этом в комментариях.
Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.
Оригинал статьи на английском - здесь.