Челлендж для нейронок: рисуем робота-доставщика "Яндекса"

Сегодня я бросила вызов известным нейронкам-генераторам изображений. Участники - Flux, Ideogram, Gemini, Kling, Runway, ChatGPT, ReCraft, Midjourney и отечественные - Шедеврум и Кандинский.

Промпт придумала заковыристый, чтобы посмотреть, знакомы ли они с российскими реалиями: "Маленький желтый робот-доставщик Яндекса медленно едет по раскисшему от весенней распутицы двору типовой панельной девятиэтажки. Пасмурный день, на асфальте глубокие лужи, отражающие серое небо и голые ветки деревьев. На одном из балконов сушится белье. Стиль: кинематографичный реализм, легкий гранж, фокус на отражениях в лужах и текстуре мокрого асфальта". (Использовался иногда в переводе на английский).

Критерии будут такими:

  • Точность соответствия промпту
  • Стилистическое соответствие
  • Техническое качество и логичность
  • Работа с текстом
  • Общее впечатление и "Вау-эффект"

Анализ и сравнение — самая интересная часть тест-драйва. Ну что ж, приступим.

Первый кандидат - Шедеврум. Все мы знаем эту разработку "Яндекса", уж она-то точно должна справиться с поставленной задачей. И...

Генерация от Шедеврума
Генерация от Шедеврума

Отличная атмосфера и окружение, узнаётся Россиюшка, белье висит (хоть и, честно говоря, странновато), но ключевой объект – это какой-то фургончик или даже автобус. Атмосферно получилось (лужа эпичная, отражение правдоподобное, весенние голые ветви деревьев). Про работу с текстом здесь совсем нечего сказать, её почти нет. Слабенько. На мой взгляд, на "троечку".

Второй кандидат - Ideogram. В прошлом челлендже (с котом и дрелью) эта нейросеть уверенно победила.

Генерация от Ideogram
Генерация от Ideogram

Ideogram опять выдал сильный результат! Здесь видим: робота-доставщика (интересная модель), здание, похожее на панельное, балкон, там чётко видно сушащееся белье. Выглядит аутентично. Лужи отличные, деревья зеленее, чем у Шедеврума, но это приемлемо. Текст четкий, читаемый (даже в отражении шрифт виден). Очень даже неплохо!

Пришло время самой популярной нейронки из списка - Midjourney. Этот генератор уже не первый год в топе, что же он покажет сейчас?

Результат от Миджорни
Результат от Миджорни

Есть жёлтый автомобильчик с колесами, но не думаю, что это робот-доставщик. На заднем плане хорошо узнаваемая панелька, справа на балконе висит белье (или на дереве, не пойму). Отлично передано тусклое освещение, реалистичная лужа, отражение в ней смотрится хорошо. Очень фотореалистично, отличная композиция, глубина резкости, цветокоррекция. На задней части "фургончика" есть четкий текст, но прочитать его невозможно. По стилю - бомба, однако есть моментики, которые разочаровывают.

Четвёртый кандидат - FLUX. Сложные у меня отношения с этим генератором: то я готова целовать его нейрончики, то перчатку бы бросила прямо в дисплей ему и на дуэль вызвала. Но интересно, что он сделает.

FLUX постарался, но...
FLUX постарался, но...

Неплох автобус, но не "вау". Дом интересный, многоквартирный, но не думаю, что панелька. Бельё, отражение, ветви деревьев, общая атмосфера - зачёт. Снега многовато. Шрифт есть, плывёт, но читаем. Этот приятель может лучше, я считаю.

Теперь слово передаю звезде последних недель - генератору от Chatgpt. Он славится хорошей работе со шрифтом, должен создать что-то фотореалистичное.

Chatgpt представляет свою генерацию
Chatgpt представляет свою генерацию

Вот это интересно! В наличии: типичная панелька на заднем плане, хороший робот-доставщик, на одном из балконов видно белье, полное ощущение пасмурной погоды, деревья без листвы, глубокие лужи с отражениями. Вот только балкон здесь в единственном числе, что не совсем типично для многоквартирного дома. Но в любом случае - заявка на победу.

Пятый кандидат - ReCraft. У него есть свои преимущества, он, как известно, умеет работать с векторными изображениями. Смотрим!

Попытка от ReCraft
Попытка от ReCraft

Здесь робот-доставщик уж слишком смахивает на радиоуправляемую машинку. С остальным, кроме текста, всё в полном порядке: деревья голы, лужи симпатичны, отражение присутствует, погода пасмурна. Неплохо, но есть нюансы.

Шестой право генерации взяла нейронка от Kling AI. Честно говоря, мой первый опыт работы с ней был не самым удачным (из-за её вполне понятной любви к азиатам). Однако видеогенератор у них очень мощный. Приступим!

Это сделал Kling AI
Это сделал Kling AI

Отличный жёлтенький красавчик, панельки имеются, балконы есть, но чётко видимого белья на них нет.Лужа на переднем плане отлично передана. Однако, по краям дорожки лежит довольно много снега, что скорее похоже на конец зимы или самое начало весны, чем на типичную грязную "распутицу". А вот ветки хороши! С текстом здесь беда, конечно. Итак, многовато снега, маловато белья на балконах.

Великолепная с��мёрка - генератор от Runway. Это известное в мире нейронок имя, не так давно они выкатили 4 версию видеогенератора. Как покажет себя эта АИ - вопрос открытый.

Runway рисует так.
Runway рисует так.

Работа с текстом неплохая: надпись читаемая, верная с точки зрения орфографии. Атмосфера передана неплохо. Есть неточности, бросающиеся в глаза: отсутствие балконов (бельё висит над окнами почему-то), мало деревьев (есть какие-то ветки).

Восьмёрочка - Visual Electric. Открыла я эту нейронку для себя во время прошлого нейрочелленджа. Тогда она выдала достойный результат.

Visual Electric рисует неплохо
Visual Electric рисует неплохо

О, вот это уже интересно! Жаль, что белья нет на балкончиках. Всё атмосферно, реалистично. Даже текст есть, если присмотреться. Достойно!

Вернёмся на родину и посмотрим, что сделает Кандинский. Ну а почему бы и нет?

Пу-пу-пу... Изображен желтый объект на колесах. Есть лужа, отражение, голые ветки. Нет балконов, здание такое себе. Он пытался писать, но у него не вышло. 
Пу-пу-пу... Изображен желтый объект на колесах. Есть лужа, отражение, голые ветки. Нет балконов, здание такое себе. Он пытался писать, но у него не вышло. 

Десяточка! Мой личный хит-мейкер - Reve AI. Я в полном восторге от этой нейронки. Жду шедевр!

 Reve AI
 Reve AI

Почти идеально! Робот, панелька - супер. Лужи, белье на балконе – всё на месте. Высокое качество, логичная сцена, но есть придирки к балконам). Идеально читаемый и правильный текст "Yandex".

Итак, кто же в лидерах? Очень субъективно, ну и что?

  1. Reve AI
  2. Chat GPT
  3. Ideogram
  4. Visual Electric

Остальные показали разную степень успеха, но имели более существенные отклонения от промпта.

Вот такие нейропироги. Бельё, как оказалось, можно вешать и без верёвок. Даже на близлежащее дерево.

Начать дискуссию