Как создать персонажа с помощью нейросетей. Пошаговый гайд
Рассказываю о том, как создать персонажа с помощью ИИ: от генерации аватара до придумывания идей и полноценной анимации. Дам список инструментов и пошаговый план действий, а также несколько полезных советов и рекомендаций. Персонаж с превью мой.
Всем привет! Меня зовут Борис, я основатель проекта "Нейронавигатор" - Телеграм-бота для изучения нейросетей с обучающими материалами и встроенными ИИ-моделями для удобной работы прямо в мессенджере.
Для всех новых пользователей мы предоставляем:
🤖 Бесплатный ChatGPT без ограничений и VPN
📚 300+ готовых промптов: протестированные шаблоны для работы с текстом, фото, видео и музыкой
💡 ТОП-100 нейросетей для работы прямо сейчас
🎓 База знаний: простые инструкции по работе с ИИ
Переходите по ссылке и получите все эти материалы:
https://t.me/NeuroNavigator_bot
Этот гайд возник спонтанно, когда я наткнулся на отличный промпт для создания персонажей в Midjourney. Он позволяет создавать мультяшных персонажей без особых усилий: достаточно написать одно слово и получить похожий результат:
Вот промпт:
a cartoon face of a [персонаж], in the style of rendered in unreal engine, playful character designs, playful colored background, toy-like proportions --ar 1:1 --v 6.1
Вариации (добавьте это слово вместо квадратных скобок):
1. hunter
2. fire fighter
3. clown
4. witch
5. chef
6. detective
7. busker
8. surfer
9. priest
Как вы могли понять из превью, я выбрал эту ведьму за основу:
Все изображения созданы с помощью Midjourney - это основной инструмент в этом гайде. Благодаря нему вы сможете переносить лица с одного изображения на другие.
Как воспользоваться Midjourney
Способ № 1: На официальном сайте
Перейдите на официальный сайт https://midjourney.com, пройдите легкую регистрацию, оплатите любой тариф (от 10$/мес) и можете начать генерировать. Сайт предназначен для работы с ПК или ноутбука. Вам потребуется иностранная карта для оплаты (по понятным причинам).
Способ № 2: С помощью Телеграм-бота
В мессенджере вы можете найти множество Телеграм-ботов, которые предоставляют доступ к Midjourney. Например, в моем боте "Нейронавигатор" встроена последняя модель Midjourney 6.1, а купить запросы можно от 500 рублей (они не сгорают и не требуют никаких дополнительных подписок). Этот способ подойдет для работы с любого устройства, даже со смартфона или планшета.
Далее в гайде я буду использовать свой Телеграм-бот. Выбранный способ никак не повлияет на сам процесс, ведь ИИ-модель работает везде одинаково.
Создаем персонажа в полный рост
Этот этап необязателен, но в целях демонстрации возможностей Midjourney я создам персонажа в полный рост - с сохранением особенностей и черт лица. Для этого нам понадобится параметр --cref, который позволяет переносить персонажа с одной генерации на другую.
Параметр --CREF работает очень просто:
1. Вы загружаете изображение с персонажем на любой хостинг, чтобы получить постоянную ссылку.
2. В конце промпта добавляете текстом "--cref" и указываете полученную ссылку.
3. Midjourney будет учитывать это изображение в последующих генерациях.
В Нейронавигаторе можно загрузить изображение и написать боту "дай ссылку", чтобы получить постоянную ссылку:
Теперь поменяем первоначальный промт. Я хочу создать персонажа в полный рост, поэтому заменю "cartoon face" на "cartoon full-body" и изменю соотношение сторон на --ar 2:3 или --ar 9:16 (расскажу о пропорциях подробнее, но чуть позже).
Отредактированный промт:
a cartoon full-body of a witch, in the style of rendered in unreal engine, playful character designs, purple eyes, playful purple background, toy-like proportions --ar 9:16 --cref https://img.pxsto.re/6985ee000d07ee07.png --v 6.1
Через пару минут получаем такой результат:
Это первая генерация, и в глаза сразу бросаются две неточности:
1. В исходном изображении более "плоский" стиль, тогда как в новом появилась игра света и тени, из-за чего персонаж выглядит более объемным и 3D-шным.
2. Это не совсем full-body (полный рост), ведь ноги не попали целиком.
Как исправить:
1. Используем еще один полезный параметр Midjourney --sref (с той же ссылкой), который предназначен для переноса стиля с исходного изображения. Работает по тому же принципу, как и перенос персонажа.
2. Чтобы персонаж всегда был в полный рост, просто укажите в промте обувь 👠. Так мы заставим нейросеть включать этот элемент в каждое изображение (годный лайфхак).
Отредактированный промт:
a cartoon full-body of a witch, in the style of rendered in unreal engine, playful character designs, purple eyes, wearing black shoes, playful purple background, toy-like proportions --ar 9:16 --cref https://img.pxsto.re/6985ee000d07ee07.png --sref https://img.pxsto.re/6985ee000d07ee07.png --v 6.1 --fast
И вот что получилось:
Новые изображения еще больше похожи на исходник, и теперь она стоит в полный рост. Но некоторые детали всё ещё отличаются.
Ограничения параметра --cref
Я создал более тысячи изображений и могу точно сказать, что Midjourney переносит около 60-70% черт персонажа и легко теряет важные детали, например цвет глаз, форму лица, прическу, одежду и т.д. В текущей версии практически невозможно получить 100% совпадения (если у вас получилось, покупайте лотерейный билет, сегодня ваш день). Но есть пара дельных советов, как достичь 90% сходства во всех генерациях:
Советы для повышения идентичности:
- Пропишите в промпте цвет глаз. В своем примере я указал "purple eyes" (фиолетовые глаза). Этот элемент срабатывает в 99% случаев и сразу дает ощутимую прибавку к идентичности.
- Укажите дополнительные детали. Например, я бы мог дополнить свой промпт и указать "оранжевый бантик", чтобы этот важный элемент одежды всегда переносился с одной генерации на другую.
- Экспериментируйте с позами, ракурсом и настроением. Удивление, страх, радость, смех — всё это лучше раскрывает персонажа и отвлекает внимание от поиска различий.
- Используйте параметр --sref. Как вы могли увидеть, перенос стиля тоже имеет значение.
- Упрощайте персонажа. Например, обычная "черно-белая панда в стиле фотореализм" почти всегда выглядит одинаково.
- Пробуйте несколько раз. Не унывайте, если не получилось с первого раза, это нормально. Иногда требуется от 2 до 5 попыток для получения нужного результата.
Начинаем придумывать сцены
Персонаж готов, и теперь начинается очень увлекательный процесс: придумывание сюжета и идей. Если вы творческий человек и налету генерируете новые идеи, а также свободно говорите на английском языке, для вас это будет простой задачей. А если нет?
Я пишу промты на английском языке (так ИИ лучше понимает контекст), но не могу сказать, что владею им свободно. Для перевода с русского на английский я часто использую ИИ-переводчик DeepL:
1. Перейдите на сайт https://www.deepl.com/
2. Напишите свою идею на русском языке
3. Получите перевод на английский и вставьте в промт
А если совсем нет идей, доверьте эту задачу ChatGPT. Напишите ему:
Я генерирую персонажа с помощью Midjourney. Твоя задача: придумать 10 описаний сцен на английском языке, где мой персонаж взаимодействует с объектами и выражает эмоции. Тема: [ведьма на Хэллоуин]. Вот хорошие примеры: [тут приведите пример описания сцены].
ChatGPT выдал мне список из 10 идей:
Беру первые попавшиеся и проверяю в Midjourney:
Отредактированный промпт:
[ПЕРСОНАЖ + СЦЕНА, например: A cartoon witch reading an ancient spellbook, her expression a mix of curiosity and excitement], in the style of rendered in unreal engine, playful character designs, purple eyes, toy-like proportions --ar 16:9 --cref https://img.pxsto.re/72a36d99a102d943.png --sref https://img.pxsto.re/c367fbed988c44a1.png --v 6.1
И вот результат:
Все изображения были получены с первого раза. Я доволен результатом и оставил как есть, хотя в некоторых случаях потребуется несколько попыток (например, если вы очень критично относитесь к разнице в одежде или форме зубов).
Как выбрать правильное соотношение сторон
Вы могли заметить, что я применяю одно и то же соотношение сторон (--ar 16:9) для всех генераций. Почему?
Ответ простой: чтобы в будущем создать короткометражный ИИ-мультфильм. Это соотношение лучше всего подходит под YouTube, и мне будет удобно склеивать анимированные изображения в видеоредакторе без потери качества и деталей.
Но если вы делаете персонажа для других целей, то вот вам шпаргалка по соотношению сторон:
- 16:9 — идеальное соотношение для YouTube; используется для горизонтального видео
- 1:1 — классический квадратный формат, отлично подходит для ИГ и ФБ, а также для создания стикеров в Telegram
- 4:5 — вертикальный формат для постов в ИГ, даёт больше пространства на экранах смартфонов
- 2:3 — более длинный вертикальный формат, хороший для изображений Pinterest
- 9:16 — оптимальный формат для TikTok и сторис в ИГ; идеально подходит для вертикального видео.
Это наиболее часто используемые форматы, хотя Midjourney в этом плане очень гибок и позволяет задавать другие значения, например --ar 78:128 или любые другие пропорции.
Как анимировать персонажа
Для этой задачи потребуются нейросети для создания коротких видеороликов (обычно длиной 5-10 секунд). Наиболее популярные из них: Hailuo AI Minimax, Kling, Runway, Pika, Luma Dream Machine, Vidu (расставил по частоте использования).
Все эти сервисы дают возможность анимировать изображения бесплатно, но с ожиданием в очереди и с наложением водяного знака. В моего бота встроен Kling для создания простых анимаций: платно, но зато быстро и без водяных знаков. Достаточно загрузить одно изображение как начальный кадр (или прикрепить сразу два, тогда они будут начальным и конечным кадром) и написать команду /kling (можно продублировать промпт, который содержит описание сцены, хотя это не обязательно, нейросеть придумает всё за вас):
А вот и результат:
И еще один:
Получилось неплохо для генерации с первого раза, но я бы попробовал еще. Любой понравившийися фрагмент можно продлить на 5 секунд (общая продолжительность до 2 минут).
Озвучивание и синхронизация губ
С этим чуть сложнее, т.к. нейронки плохо справляются с этой задачей (субъективное мнение). Но недавно Runway выпустил новую функцию Act One, которая предназначена именно для этого. Вы можете записать видео с самим собой, и персонаж начнет говорить вашим голосом и синхронно двигать губами. Вот пример из Твиттера:
Я ее еще не достаточно изучил, пробовал всего несколько раз. Например, за основу взял мем и вот что получилось:
Получилось не то, что я ожидал. Думаю, это из-за неудачно подобранного видео (слишком низкое качество). В идеале записать видео самостоятельно и в хорошем качестве, но я сделаю это в следующий раз.
Где искать промпты для персонажей
Я добавил большую подборку готовых промптов для создания персонажей. Она доступна бесплатно всем желающим в моем боте. достаточно отправить боту слово "персонажи" или перейти в раздел "Библиотека промтов" - "Изображения" - "Люди и персонажи". Там вы найдете около 30 рабочих промптов с различными вариациями, которые позволят создать персонажа на любой вкус и цвет:
Ссылка на бота: https://t.me/NeuroNavigator_bot
На этом пока всё. Я бы мог написать еще больше про анимацию, т.к. там очень много подводных камней и ограничений, о которых нужно знать. Но это будет в следующий раз, когда (и если) я начну создавать полноценный мультфильм на основе этого персонажа. Небольшой спойлер: это очень трудоемкий и дорогой процесс. Если очень хотите, поставьте лайк и напишите комментарий, это будет дополнительной мотивацией.
Буду рад обсудить все детали в моем Телеграм-канале: Boris AI – нейросети для работы и хобби. Он новый и там пока мало людей, поэтому смогу ответить на все ваши вопросы. Спасибо, что дочитали до конца и удачных генераций!