Emu от Meta VS Midjourney 5.2: какой ИИ-генератор изображений лучше?

Сфера искусственного интеллекта для генерации изображений в настоящее время находится на подъеме. Недавно Adobe выпустила вторую итерацию Firefly, OpenAI запустил Dall-E 3 с интеграцией ChatGPT, а Midjourney представила 4-кратное увеличение масштаба своих изображений.

Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.

2 ноября компания Meta* AI присоединилась к генерации изображений, анонсировав свою собственную ИИ-модель изображений под названием Emu.

Я заметил, что первые результаты работы Emu, выпущенные компанией Meta, вполне сопоставимы с результатами работы Midjourney 5.2. Поэтому в этой статье я сравню изображения, полученные с помощью Emu и Midjourney, используя аналогичные промпты.Давайте начнем.

Промпт: an afrofuturist lady wearing gold jewelry

Обе модели ИИ способны генерировать очень сложные и высокодетализированные изображения. Теперь все сводится к личным предпочтениям. Для меня более предпочтительным является изображение справа, созданное Emu.

Промпт: a playful kitten amusing itself with a yarn in a room bathed in sunlight

Обе кошки выглядят очаровательно! Но мне кажется, что та, что справа, выглядит более реалистично.

Промпт: a cool orange cat wearing sunglasses playing a guitar with a group of dancing bananas

Midjourney не удалось создать целостный образ для этого промпта. Персонажи на заднем плане - не бананы. Так что по связности здесь победил Emu.

Промпт: a horse reading a book

Опять же, оба изображения впечатляют. Лично мне больше нравится причудливый стиль изображения Midjourney.

Промпт: a painting of an adorable rabbit sitting on a colorful splash

На изображении Midjourney кролик, похоже, не сидит на брызгах, поэтому в этом раунде по согласованности победил Emu. Но оба этих изображения выглядят креативно.

Промпт: a light bulb containing a sailboat floats through the galaxy

Для данного промпта ни одна из моделей ИИ не оправдала ожиданий. Я не вижу ни парусника внутри лампочки, ни образов, плавающих в галактике. Однако Emu оказался ближе.

Промпт: eerie man, but not genuinely frightening

Оба выглядят жутковато, но изображение Emu справа менее пугающее, чем указанное. Изображение Midjourney напоминает персонажа фильма ужасов.

Промпт: an emu wearing sunglasses and chilling on a beach

Мне нравятся оба этих фантазийных изображения эму! Какое из них вам больше нравится?

Промпт: a woman on a bed underneath a blanket

Опять же, изображение Emu справа выглядит более естественно и реалистично. Midjourney иногда слишком сильно стилизует результаты.

В целом, Emu создал изображения более убедительные и последовательные, чем Midjourney 5.2. В течение долгого времени я был поклонником Midjourney, но Emu, судя по этим результатам, является очень близким, а иногда и лучшим конкурентом.

Emu демонстрирует сочетание возможностей когерентности Dall-E и эстетики Midjourney. Но важно отметить, что компания Meta до сих пор не выпустила специализированный сайт для генерации AI-изображений с помощью Emu. Это означает, что изображения, которые я использовал в этой статье для Emu, были предварительно отобраны авторами исследовательской работы.

Я надеюсь, что эта статья была вам полезна, и если вам интересно посмотреть, как Emu сравнивается с Dall-E 3 или Adobe Firefly 2.0, пожалуйста, напишите мне об этом в комментариях.

Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.

#midjourney #midjourney5 #emu #генерацияизображений #ai #нейросети

Оригинал статьи на английском - здесь.