Убийца Midjourney? SDXL 0.9 vs Midjourney

Компания Stability AI представила обновлённую версию нейросети для генерации изображений по текстовому описанию Stable Diffusion — она получила название SDXL 0.9.

По сравнению с предшествующей новая версия обещает создание более качественных и детализированных фотореалистичных картинок.

«Инопланетяне гуляют среди нас в Лас-Вегасе, найденная плёночная фотография». Слева — работа Stable Diffusion XL, справа — SDXL 0.9.
«Инопланетяне гуляют среди нас в Лас-Вегасе, найденная плёночная фотография». Слева — работа Stable Diffusion XL, справа — SDXL 0.9.

Разработчик охарактеризовал новую модель искусственного интеллекта как «прорыв в творческих вариантах применения генеративного ИИ изображений».

«Волк в Национальном парке Йосемити, документальная съёмка природы»
«Волк в Национальном парке Йосемити, документальная съёмка природы»

В этой статье я постараюсь разобраться, так ли хороша эта нейросеть, а также сравню её в некоторых аспектах с Midjourney, которая пока считается лучшей.

«Рука с маникюром держит кофе навынос, рассвет в пастельных тонах, пляж, Instagram* и плёночная фотография»
«Рука с маникюром держит кофе навынос, рассвет в пастельных тонах, пляж, Instagram* и плёночная фотография»

Доступность и цена

У Midjourney есть некоторые ограничения, связанные с популярностью платформы.

Чтобы сохранять работоспособность серверов, разработчики предоставляют бесплатный доступ, ограниченный 25 операциями или попытками. В этот лимит включаются любые команды, которые требуют использования нейронных сетей, включая повторную генерацию той же картинки с другим результатом и функцию увеличения изображения.

Если вы используете сервис Midjourney, то имейте в виду, что каждое действие, которое вы выполняете, расходует одну из ваших попыток. Например, нажатие кнопок V, U и круг также будет уменьшать количество ваших попыток.

Если вы хотите воспользоваться платными возможностями Midjourney, то цены на подписку следующие: базовый план (200 GPU-минут в месяц) стоит 10 долларов в месяц (~600 рублей), стандартный план (15 GPU-часов в месяц) стоит 30 долларов в месяц (~1800 рублей), а корпоративный план (120 GPU-часов в год) стоит 600 долларов в год (~35 600 рублей).

"GPU-минуты/часы" - это количество действий, которые можно выполнить в рамках выбранного тарифа. Например, лимит в 200 GPU-минут в месяц на базовом плане подписки означает, что вы можете сгенерировать до 200 изображений в месяц. Если вам нужны дополнительные попытки, вы можете их докупить за 4 доллара (~240 рублей) за один GPU-час, что составляет примерно 60 команд генерации или масштабирования изображения.

Стандартный план за 30 долларов в месяц предоставляет пользователю 15 GPU-часов (900 GPU-минут) в месяц - это очень много возможностей для создания изображений.

Что насчёт SDXL 0.9? Доступ к модели можно получить через ClipDrop уже сегодня. Пока идёт бета-тест и все работает бесплатно. Но к концу бета-теста, когда разработчики исправят все баги и неточности, доступ скорее всего станет платным. Но пока не будем гадать наперед.

Качество генерируемых картинок

Я ввел запрос man (ссылку на нейросеть оставлю в конце статьи) и вот какие 4 варианта мне выдала SDXL 0.9.

По моему личному мнению, качество изображения ничуть не уступает Midjourney, а иногда даже качественнее.

Midjourney 5.2
Midjourney 5.2
SDXL 0.9
SDXL 0.9

Посмотрите на два изображения птицы выше. На генерации ниже — результат работы SDXL 0.9. Выше — новая версия Midjourney 5.2.

Создание изображения происходило на базе одного и того же промта:

an painting by the artist of the dream world, in the style of hybrid creature compositions, intricate psychedelic landscapes, hyper-realistic bird studies, colorful moebius, weirdcore, pink and cyan, cybermysticpunk

С ходу в глаза бросается объемность, тени и детализация от SDXL 0.9. Пока что Stable Diffusion выглядят поувереннее.

И да: нейросеть Stable Diffusion научили генерировать нормальные человеческие пальцы. Во всех сервисах для генерации изображений с этим были большие проблемы.

SDXL 0.9 предлагает огромное количество разных стилей: фотореалистичный, аниме стиль, диджитал-арты, иллюстрация и многое другое. Сравнение стилей между собой можете посмотреть ниже

Удобство

Не скажу, что Midjourney неудобен, но чтобы начать им пользоваться, нужно сделать определенные манипуляции. Со SDXL 0.9 все намного проще: зашёл на сайт, пишешь свой запрос и получаешь результат.

Итог

SDXL 0.9 не уступает Midjourney ни по каким показателям, изображения генерирует очень даже хорошо. А ведь нейросеть находится на этапе бета-теста, поэтому у нее есть все шансы стать ещё лучше.

Напомню, что выход SDXL 1.0 с открытым исходным кодом намечен на середину июля.

Канал с качественными промтами:

Попробовать Midjourney бесплатно:

27
18 комментариев