Гайд по коллажам в Artbreeder: нейросеть создаёт изображения из текста, каракуль, фото или всего сразу

Гайд по коллажам в Artbreeder: нейросеть создаёт изображения из текста, каракуль, фото или всего сразу

Идеальная нейросеть для новичков, чтобы научиться составлять запросы, ошибаясь и пробуя разное. После неё гораздо проще работать со всякими DALL·E 2, Midjourney и Stable Diffusion.

Я провёл за этой нейросетью несколько месяцев и уже поошибался вместо вас. Постарался описать сильные и слабые стороны этой нейросети и поделиться опытом, чтобы вы сразу смогли получать крутые результаты.

Статья рассчитана на новичков, которые никогда не работали с нейросетями (но если работали, то тоже будет интересно, надеюсь). Не нужно уметь рисовать, разбираться с кодом или как-то серьёзно вникать.

Чем хорош artbreeder.com

Бесплатный и без лимита на количество генераций. Есть платные фичи: быстрее рендерить, получать качество получше, какие-то ещё штуки. Но без них легко можно обойтись.

Если нужно получить разрешение картинки повыше, а платить нет возможности — воспользуйтесь сервисом для апскейла изображений.

Общедоступный и живёт в браузере. У DALL·E 2 были закрытые списки, куда не попасть простому смертному, сейчас бесплатно дают 15 попыток, а дальше плати. Stable Diffusion вроде в открытом доступе, но его надо скачивать, устанавливать, ковырять код — с разбега не влетишь. Или искать платные сервисы вроде DreamDiffusion, которые сделали веб-интерфейс для Stable Diffusion и дают им пользоваться за деньги.

Выдаёт крутой результат, гораздо лучше того же DALL·E mini. Он самый мощный из бесплатных, быстрых и с веб-мордой.

Результаты можно использовать в коммерческих проектах. По лицензии сервиса все права на изображения не принадлежат никому. Создатели просят ставить на них ссылку, но это всего лишь просьба, а не обязанность.

Где эти ваши коллажи Artbreeder

Сам сервис не новый. Наверняка вы видели примеры работ оттуда или сами пробовали что-то сделать.

Недавно они обновили дизайн и выкатили новый крутой инструмент: коллажи.

Гайд по коллажам в Artbreeder: нейросеть создаёт изображения из текста, каракуль, фото или всего сразу

1. Это старые функции. Их много, они крутые, но в этот раз речь не про них.
2. Новый инструмент «коллажи». Это генеративная нейросеть на основе того же StableDiffusion, вся эта статья — про неё.

А пока расскажу, что умеет нейросеть и как ей пользоваться. Вначале примеры будут страшненькие, не надо пугаться.

1. Генерируем арт по текстовому запросу

Да, тут можно генерировать картиночки из текста прям как в настоящем DALL·E 2.

При первом запуске в окне уже будет какой-то коллаж и текстовый запрос, но для удобства повествования я расскажу всё по порядку.
При первом запуске в окне уже будет какой-то коллаж и текстовый запрос, но для удобства повествования я расскажу всё по порядку.

Откроется холст с инструментами. На инструменты пока не смотрим, а пишем просто текстовый запрос (или промт).

Как писать текстовый промт.
Запросы короче 5 строк работают лучше.

Сложные позы, несколько персонажей, подробные требования к композиции нейросеть воспроизводит с трудом: либо выдаёт бракованные изображения, либо вообще не понимает эти описания и игнорирует их.

Фразы вроде highly detailed, intricate, high definition помогают добавить детали и мелкие подробности в изображение. Появляются складочки, морщинки, текстуры — изображение выглядит менее кукольным и более живым, проработанным.

Для стилизации прод определённые художественные стили лучше работают имена художников или произведений. Можно написать cyberpunk, но лучше — blade runner, H. R. Giger. Вместо art nouveau — Alphonse Mucha.

В чужих промтах я встретил фразу face by tom bagshaw и стал часто её использовать. Это диджитал-художник, который рисует портреты с характерной симметричной композицией и готичной цветовой палитрой. Получается симпатичнее.

Например:

Мой запрос слишком длинный и подробный — у нейросети происходит перегруз и вылезают лишние конечности
Мой запрос слишком длинный и подробный — у нейросети происходит перегруз и вылезают лишние конечности

С анатомией человека получились проблемы, но это можно поправить, скорректировав запрос. В этом примере следует сократить промт раза в два: избавиться от лишнего описания позы, выражения лица и интерьера. Нейросеть плохо понимает такое и не может нормально воспроизвести.

Простые запросы в этом режиме работают лучше. Например, льва для обложки я получил именно этим способом — одним текстом
Простые запросы в этом режиме работают лучше. Например, льва для обложки я получил именно этим способом — одним текстом

2. Генерируем арт из каракуль

Слева — панель инструментов. С их помощью на холсте схематично собираю композицию из примитивных фигур. Это и есть тот самый «коллаж».

Он даёт контроль над композицией кадра, в отличие от других нейросетей вроде DALL·E 2 и Midjourney.

Воспользовался только карандашом и библиотекой картинок.
Воспользовался только карандашом и библиотекой картинок.

В своём примере я накидал на холст примитивных фигур, слегка их трансформировал. Руки, ноги и рот рисовал карандашом.

Поле с текстом оставил пустым.

Нейросеть попробует сама понять, что изображено на холсте. И она интерпретирует это, как ей самой хочется:

Как и все генеративные нейросети, artbreeder пока что не знает грамоты — вместо букв белиберда
Как и все генеративные нейросети, artbreeder пока что не знает грамоты — вместо букв белиберда

Почему нейросеть решила превратить композицию в плакат? Без понятия, такое зерно попалось (про зёрна будет дальше).

Следующий инструмент — Слайдер AI. Он активируется, когда в режиме редактирования что-то появляется на холсте. Он управляет тем, насколько вольно нейросеть обращается с исходной композицией и промтом. Представьте это плавным переключателем между «заткнись и делай что сказано» и «в этот проект я душу вложил».

Нет универсально лучшего положения слайдера. Каждый раз приходится подвигать туда-сюда, чтобы выбрать удачный вариант
Нет универсально лучшего положения слайдера. Каждый раз приходится подвигать туда-сюда, чтобы выбрать удачный вариант

Я подрыгал значения слайдера, не меняя больше ничего. Вот как он влияет на результат:

3. Генерируем арт из каракуль + текста

Теперь комбинируем — к этому коллажу добавим текстовый запрос из первой части.

Слайдер AI — на 70%. Тут запрос из первого примера и коллаж из второго.
Слайдер AI — на 70%. Тут запрос из первого примера и коллаж из второго.

Очевидно, что когда есть какой-то визуальный исходник и текст с ТЗ, нейросеть чувствует себя гораздо уверенней.

Я заметил, что стрёмненький коллаж из разных слоёв работает лучше, чем полноценная иллюстрация из одного слоя. Кажется, нейросетке проще, когда она понимает, где какие элементы.

Слайдер AI — на 70%. Тот же запрос, то же зерно
Слайдер AI — на 70%. Тот же запрос, то же зерно

Теперь рванём рубильник безумия на максимум:

4. Генерируем арт из каракуль + фото + стоковых картинок + текста

В этом режиме нейросеть на пике своей формы: можно накидать рандомных объектов, попросить сделать красиво и получить красивое.

Я добавил фото и картинок из библиотеки клипарта к нашему примеру.

Слайдер AI — на 100%. Нейросеть, «вдохновляясь» исходным изображением нарисовала требования из текстового запроса.
Слайдер AI — на 100%. Нейросеть, «вдохновляясь» исходным изображением нарисовала требования из текстового запроса.

Видно, как работает противоречие между композицией на холсте и промтом. От рамы остался цветовой тон, Марс превратился в рыжие волосы. В остальном это грустный парень, как и просили.

Но если я хочу получить именно Илона и Марс, нужно отредактировать промт. Коллаж оставлю тем же самым

Поменял промт — и один и тот же коллаж становится артом в любом стиле
Поменял промт — и один и тот же коллаж становится артом в любом стиле

Что такое «зерно»

Гайд по коллажам в Artbreeder: нейросеть создаёт изображения из текста, каракуль, фото или всего сразу

Этот счётчик отвечает за «зернышко», seed. Зерно — это элемент контролируемой случайности у нейросетей, чтобы получать разный результат с одними и теми же вводными.

Зёрна влияют на кучу всего: на композицию, на цвет, на стиль изображения, на содержание, на интерпретацию исходников, на связи внутри самой нейросети. Чтобы делать красиво, в это вникать необязательно.

По сути, это кнопка «дай ещё вариант». И так из одного исходника (коллажа + текста) мы можем получить сколько угодно арта. Я тут ничего не менял ни в запросе, ни в композиции, просто тыкал одну кнопку:

Благодаря разным зёрнам нейросеть по-разному интерпретирует промт и коллаж. Получается, что работа с нейросетью получается итеративной: составить запрос и коллаж → найти интересное зерно → доработать запрос и коллаж, чтобы получить в этом зерне крутой результат → повторить.

К предыдущим вариантам всегда можно вернуться, если не менять коллаж и промт: просто ввести нужный номер зерна.

Когда я говорил, будто что-то работает «лучше», я на самом деле имел в виду «чаще». Можно написать вообще что угодно в промт и собрать какой угодно коллаж, щёлкать варианты и получить результат. Вопрос в том, сколько попыток и времени для этого потребуется.

Например.

Порядок фраз внутри запроса неважен, если перебирать разные зёрна. Но внутри конкретного зерна порядок фраз имеет значение.

Грамматически правильные промты работают чаще, если перебирать разные зёрна. Но внутри конкретного зерна можно нарушать правила: даже смена артикля с «a» на «the» или пропуск артикля меняют результат и помогают избавиться от брака и артефактов изображений.

5. Генерируем арт, вдохновляясь другими

Удачные варианты можно сохранить. Это позволяет вернуться потом к этому арту и на его основе сделать что-нибудь новенькое.

Гайд по коллажам в Artbreeder: нейросеть создаёт изображения из текста, каракуль, фото или всего сразу

Сохранённый арт попадает не только в профиль, но и в фид на главной странице. Если другие пользователи будут часто лайкать эту работу, она попадёт в рекомендации и её увидит больше людей.

Гайд по коллажам в Artbreeder: нейросеть создаёт изображения из текста, каракуль, фото или всего сразу

Полезно лайкать чужие работы — так они сохраняются в закладках. К ним можно вернуться позже, чтобы посмотреть, как они сделаны.

Здесь видно, из каких предыдущих чужих работ сделан этот арт, какие на его основе сделали ещё арты. Можно лайкнуть, присвоить тег — вот это всё.

Я открыл один из чужих артов со скриншота выше
Я открыл один из чужих артов со скриншота выше

Если нажать Remix — проваливаемся в редактор, виден оригинальный коллаж и текстовый запрос:

Если просто нажать Render — получим тот же результат, что и у автора
Если просто нажать Render — получим тот же результат, что и у автора

Изменив запрос и коллаж, можно сделать собственный арт в похожем стиле:

Не стесняйтесь использовать чужие работы внутри Artbreeder. Я не имею в виде воровать. Можно подсмотреть интересные промты и коллажи, можно на основе чужой работы создавать свой арт.

Breeder — это по-английски буквально «человек, который выводит новые породы животных». Сервис создан специально для того, чтобы пользователи использовали арт друг друга для создания новой красотищи.

Для каких задач Artbreeder не подходит

Плохо создают что-то конкретное. Если нужно изобразить портрет знакомого человека, сложную позу или вашу любимую чашку для чая — это или потребует кучу усилий, или вообще не получится сделать.

Загрузить фотографию мало поможет: нейросеть видит изображение не так, как человек. К примеру, я загружаю фото моей подруги Кристины. Нейросеть не понимает, что это конкретный человек. Она видит формы, цвета и вроде бы все вместе они напоминают девушку.

Нейросеть выдаёт изображение, сгенерированное ею самостоятельно с нуля. Даже если попытаться воссоздать исходник — получится похоже, но не совсем то
Нейросеть выдаёт изображение, сгенерированное ею самостоятельно с нуля. Даже если попытаться воссоздать исходник — получится похоже, но не совсем то

И когда дальше я прошу нейросеть сделать красиво, он создаст не портрет моей подруги Кристины, а портрет абстрактной красивой девушки.

На холсте только фото + добавил промт
На холсте только фото + добавил промт

Я получу портрет, если только уточню, что именно хочу получить в итоге. А без текста могу получить портрет затылка красивой девушки, куртку-парку или топливо для ночных кошмаров.

На холсте только фото, промта нет. Почему нейросеть выдала затылок и парку? Без понятия, нейросеть так решила
На холсте только фото, промта нет. Почему нейросеть выдала затылок и парку? Без понятия, нейросеть так решила

Исключение — знаменитости. Нейросети тренируют в том числе и по портретам известных людей, поэтому нейронка может воспроизвести достаточно узнаваемый портрет.

Сгенерировал несколько примеров. Пишите в комментариях, кого не смогли узнать:

Вывод: Artbreeder — это не инстаграм-фильтр на картиночки. Он генерирует оригинальный арт, а не редактирует фотографию.

Если хотите создавать персонажей со своим лицом с помощью нейросетей — это можно сделать с помощью Stable Diffusion. Для этого придётся дополнительно обучать нейросеть, да и потом придётся попотеть. Вот видео, где сделали подобное.

Плохо создаёт серии изображений с заданными различиями. Не получается менять позу созданным персонажам, просто добавляя в промт «смотрит влево», «смотрит вправо», «руки в стороны», «ноги на ширине плеч».

Чтобы это был один и тот же персонаж в одном и том же стиле, придётся использовать одно зерно. Но при редактировании промта и коллажа либо начнут вылезать артефакты, либо нейросеть проигнорирует эти указания. Если же поменять промт или коллаж слишком сильно — то не получится сохранить сходство стиля.

Если остались вопросы или хотите меня поправить — пишите в комментариях.

Подписывайтесь на мой профиль в artbreeder, чтобы вдохновляться творчеством друг друга.

Гайд по коллажам в Artbreeder: нейросеть создаёт изображения из текста, каракуль, фото или всего сразу
66
3 комментария

Сюр выходит классный. Ну и хорошо, что не только сюр умеет делать.

1
Ответить

Ну, животные, портреты абстрактных людей и знаменитости тоже круто получаются)

Ответить

Артбридер сгенерировал мне нечто восхитительное

Ответить