Нейросети как инструмент для дизайн команды: Midjorney, Stable Diffusion, Dall-e 2
Привет всем, меня зовут Олег Вишневский, я диджитал дизайнер и артдиректор, руковожу небольшой командой мультидисциплинарных дизайнеров и лоукод разработчиков.
Уже несколько месяцев мы активно используем нейронки для создания текстового и визуального контента. В публикации поделюсь опытом выбора рабочего инструмента для команды дизайнеров.
Дисклеймер: эта статья не претендует на абсолютную истину. Вполне вероятно, мы что-то упускаем, и если у вас есть дельные советы — пишите в комменты!
Наши требования к инструменту были такими:
- Статичные картинки
- Возможность командной работы
- Облачное хранилище
- Приватность результатов
- Возможность коммерческого использования
Быстро стало понятно, что без костылей и компромиссов пока не обойтись.
Мы рассматривали ключевых представителей индустрии на данный момент. Так как в принципе есть много решений сомнительного качества, но на перспективу они будут развиваться медленнее. Например клон Dall-e от Сбера, работает долго, нудно, и с очень средним результатом.
У ключевых игроков свои нюансы, разумеется если вбивать им одинаковые промты они выдают очень разный результат, есть хорошая статья на эту тему со сравнением.
Midjourney
Самая популярная нейронка, одна из первых вышла в публичный релиз. Идеально подойдёт, если нужно быстро начать работать.
Характеристики
- Закрытая система, нет апи
- Стилистика результатов получается более артовой
- Консоль — Discord чат
Как пользоваться
- Регистрируем один аккаунт в Discord
- Cоздаём свой сервер
- Покупаем тариф
- Добавляем на свой сервер, бота Midjourney
- Пользуемся всей командой одним аккаунтом Discord
Плюсы
- Можем видеть результаты работы и промпты всей команды, работать над одним изображением коллективно
- Коммерческое использование результатов на платной подписке
Минусы
- Могут быть проблемы с входами в аккаунт Discord из разных ip адресов, если используем один аккаунт
Цены
- 10$ Basic Plan ~ 200 изображений в месяц
- 30$ Standard Plan ~ 900-1800 изображений в месяц
- 60$ Pro Plan ~ почти анлим, плюс приватность результатов
- Есть бесплатный вариант но это неудобно
Stable diffusion
Наверное самая продвинутая нейронка, с большим колличеством настроек, очень перспективная, более четко следует запросу при настройках по умолчанию.
Характеристики
- Опенсорс система, есть апи
- Стилистика результатов получается реалистичной
- Консоль — настраиваемая
Как пользоваться
- Коммерческие сборки dezgo.com — один из многочисленных онлайн вариантов SD просто чтобы попробовать и сравнить с другими решениями
- Есть бесплатное GPU ядро от Google, есть инструкция в статье, или видео, но там все сложно
- Коммерческая облачная платформа, например Google Cloud Platform, сервера дороговаты
- Свой сервер, но с установкой без девелоперов не разобраться
Плюсы
- Нет ограничений на генерируемые изображения
- Бесплатно, если не считать издержек в виде мощного железа или оплаты сервера
- Коммерческие права принадлежат вам
- Поддается собственному обучению
Минусы
- Сложная установка
- Если не используешь коммерческую сборку то рендерит у тебя на компе, на макбуках будет не быстро
- Нельзя коллективно просматривать результаты генерации
Dall-e 2
Нейронка с самой долгой историей развития. Генерит самые реалистичные картинки, позволяет гибко настроить полученный результат.
Характеристики
- Закрытая система, есть апи
- Стилистика результатов получается реалистичной
- Консоль — сайт
Как можно пользоваться
Все просто: регаемся и вперёд. Можно поискать другие коммерческие решения с более выгодными тарифами, например, на гитхабе, возможно, появились варианты сборок десктоп- или веб-приложений на основе Dall-e api. Нужно разбираться.
Плюсы
- Доработка исходного изображения, дорисовывание любых его частей
Минусы
- Не подходит для командной работы
- Могут быть проблемы с частыми входами в акк с разных ip адресов
- Нет анлим тарифа
- Генерирует только квадратные картинки
- Права на все сгенерированные изображения принадлежат им, вопрос коммерческого использования
Цены
50 кредитов при регистрации, 15 бесплатно каждый месяц. Еще 115 кредитов можно купить за $15 USD. Одна генерация — один кредит.
Какие выводы для себя мы сделали
- Хочется использовать все три решения сразу, тестировать итд
- Хочется не мучатся с установками (вероятно как вариант можно заказать настройку)
- Переплачивать — не хочется
- Командных планов к сожалению пока особо нет
- Вопрос коммерческой лицензии придется как-то решать
Максимально удобный сетап который мы выбрали для себя
Midjourney — используем нативно, как описал выше, надеемся что не будут блочить из за заходов со слишком разных ip. (60$ в месяц)
Stable diffusion + Dall-e 2 — мы выбрали коммерческую сборку (не реклама), которая нам показалась удобной. Она объединяет в себе обе нейронки, подписка стоит 10-25$ в месяц, есть и бесплатный тариф.
Коллеги, если знаете более оптимальное решение — пишите в комментариях, спасибо!
Спасибо Данилу Шевченко за помощь в рисерче.