Сравнение визуала графических нейросетей
Хочется больше внимания уделить стилям изображений и продемонстрировать их различия на ярких примерах. Взяла 4 нейронки: Flux, Ideogram, Visual Electric и конечно же Midjourney. Чтобы никто не отвлекался на лица, в промпте указала, что девушка бежит спиной к зрителю. Отправной точкой в нашем сравнении будет картинка из Флакса.
Идеограм (пикча ниже) позволяет ремиксить в нём картинку-оригинал вплоть до 100 процентов смешения. При этом даже на 100%, разумеется, меняется цветовой, светотеневой рисунки и анатомия.
Для наглядности я смешала на 80%, чтобы было чётко видно различие в стилях.
- И возможно не самое явное отличие — увеличение деталей и шероховатости изображения. Мыльный Флакс превращается в детализированную картинку.
- То, что сразу и явно бросается в глаза — потеря насыщенности.
- И не самое очевидное — изображение становится более плоским. Старички знают, что для оценки светотеневого рисунка, надо перевести фото в чб (щас такому на энтих вашенских курсах не учут). Таким образом мы можем увидеть потерю глубины и объёма:
А если приблизим картинку, то увидим, что детали-то как раз потерялись, теневые участки попросту "выбиты", информация в них потеряна и такие участки без перегенерации восстановить невозможно:
А сейчас придётся сделать небольшое отступление. Так ремиксят ту же самую картинку Вижуал Электрик и Миджорни:
И так как Вижуал Электрик почти потерял свой стилёк при ремиксе картинки, а Миджорни… я даже хз как объяснить то, что он сделал, проведём сравнение на промпте. Выбрала варианты с блондами, так будет более наглядно.
- На этой картинке яркая демонстрация по-настоящему высокой контрастности и насыщенности. Кстати говоря, в чб такая пикча смотрится лучше остальных, но есть свои нюансы. Например, фон с деревьями сильно темнее и контрастнее девушки, что делает его как будто бы резче. И это, к слову, одна из причин, почему в цветном варианте изображение выглядит "вырвиглазно".
2. А вот в случае с Миджи можно сказать, что достигнут идеальный баланс. Спасибо нейробогу, что мы не видим девушку ниже грудного отдела, а то можно было бы разочароваться. Но по цветам, текстуре, светотеневому рисунку и воздушной перспективе это эталон художественной фотографии. Такие картинки легко идут на баннеры и блоги путешествий. А вот "фотография" с Вижуал Электрик явно больше подойдёт для новости о каких-нибудь спортивных соревах.
Ну и завершила всё общими раскладками для наглядной демонстрации.
Задавайте вопросы, дополняйте комментариями, а при большом желании можете подписаться на мой ТГ-канал, где я рассказываю о работе дизайнера с нейросетями и не только.