Как нейросети всё делают за меня, а я за них

Ремар’очка: это не туториал, а просто подробный разбор процесса.

Допустим, моя задача — генерация “фотосессии“ с разными людьми в разных ситуациях. Например, мать обнимает ребёнка и держит в руках пасхальное яйцо. Обстановка домашняя, светлая.

С чего начинаю? С разбора ТЗ и похода в ChatGPT за промптами. Потом в Midjourney — там генерирую серию картинок в едином стиле, с разными людьми и сюжетами. Минимум 30 штук: бегущие дети, объятия и т. д. — чтобы потом собрать из них датасет.

Как нейросети всё делают за меня, а я за них

Дальше отбираю удачные варианты: смотрю на ракурс, образы, цвета и текстуры.

После этого загружаю картинки в Krea для тренировки стиля. Таким образом я получаю:

  • стиль Midjourney,
  • анатомию Flux,
  • удобное управление промптом во Flux.

Krea позволяет работать с разными моделями, но тренировка лоры и генерация в стиле этой лоры происходят именно на Flux.

Как нейросети всё делают за меня, а я за них

Теперь могу сгенерировать нужный сюжет сразу в баннерном разрешении 16:9. Для начала покажу картинку без стиля:

Как нейросети всё делают за меня, а я за них

А вот с настроенным стилем:

Как нейросети всё делают за меня, а я за них

Так создаю целую серию. Если работаю с брендом, уточняю для ChatGPT, какие нужны сцены, цвета, одежда, интерьеры, и получаю пул промптов для генерации.

Далее первичная ретушь. Мне нравится глубина на этом кадре из-за цветка на переднем плане, но он будет мешать тексту. Вообще, здесь мало места под текст, так что надо сделать аутпейнт (расширение картинки с догенерацией, см. мой нейрословарь).

Как нейросети всё делают за меня, а я за них

Апскейл. Можно провести только в Магнифике (х4, иногда х8), но если исходник слабый, например, мелкие фигуры людей вдали, то Магнифик внесет много своей анатомии. В таких случаях сначала делаю предварительный апскейл во Flux на компе — получится мыльновато, но поправится анатомия и общие черты персонажей.

Вот яркий пример косяков — после Magnific у свитера появились артефакты, а лицо ребёнка состарилось:

Как нейросети всё делают за меня, а я за них

Но допустим клиент выбрал именно это фото под большой баннер. Тогда маме надо распахнуть глаза, чтобы она смотрела на дочь + её взгляд будет условно направлен в сторону пустой зоны, зоны текста. Ну и конечно, девочку снова нужно сделать девочкой. Чтобы всё это провернуть, иду в Фотошоп, отрезаю от изображения кусок с “неправильным“ участком и инпейнчу его в Идеограм или Флакс.

Фотошопный инпейнт использую редко — он больше подходит для удаления мелких деталей. Картинку режу на части, иначе либо комп не потянет, либо Ideogram выдаст маленькую мутную версию (в зависимости от того, где редачу картинку).

Итак, в случае с лицами и свитером получаем это:

Как нейросети всё делают за меня, а я за них

Такие же манипуляции проделываю с руками, ногами, одеждой и т.д. для этого и других изображений. Ну а после их можно ставить на большие баннеры с кайфом:

Как нейросети всё делают за меня, а я за них

Если вы знаете локальный апскейл, который бы давал такую же классную резкость и текстуру как Магнифик, напишите об этом в комментариях. И подписывайтесь на мой канал, где я рассказываю о работе дизайнера с нейросетями.

2 комментария