Отечественный AI-генератор картинок в Telegram от TurboText

Midjourney, DALL-E 2, Jasper Art — генераторы изображений, о которых в 2022 году услышал практический каждый, кто интересуется нейросетями или занимается контентом.

Российские программисты внедрили нейросети для генерации изображений прямо в Telegram — TurboText_bot. Также есть англоязычный бот с тем же набором функций.

Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.

Отечественный AI-генератор картинок в Telegram от TurboText

Нейросеть TurboText генерирует реалистичные картинки и аниме, придумывает расширенные текстовые запросы для создания хорошего изображения и увеличивает размер картинки до 3072х3072.

Реализм

Красивый белый шпиц в профиль на фоне скандинавского пейзажа со звездным небом созвездий северного сияния

<p>Мужчина десантник в голубой футболке в белую полоску</p>

<p>Cute Millie Bobby Brown, Eleven from "stranger things", monochrome, portrait photo, 35 mm, width: 1024, height: 1024</p>

portrait of a Michael Jackson as an undead skeleton lord,cinematic, soft cinematic light, slate gray atmosfere, hdr,cinematic lighting, immense detail, photorealism, ultra realistic, professional photography, depth, beautiful lighting, epic composition

уютное рабочее место за открытым ноутбуком с прекрасным видом из окна, светлые тона, на столе один открытый ноутбук и чашка чая рядом, нежное теплое освещение, снег за окном, заснеженные ели

<p>Human Heart Made of Fruits and Vegetables</p>

<p>мультяшная милая панда профессор сидит в школьном классе и читает книгу</p>

Аниме

<p>store full of curious collectibles :: incredible, anime, Digital 2D, animated by Kyoto Animation, Studio Ghibli, Miyazaki, AKIRA art style, beautiful, gorgeous, dramatic lighting</p>

<p>красивая девушка в кожаном платье, русые волосы и зеленые глаза с черным футуристическим автомобилем реалистично 3d визуализация высокого качества</p>

<p>самое красивое произведение абстрактного искусства из когда-либо созданных, смешанная техника, пастельные тона, померанский шпиц, дерево, листья, цветы, капля чернил в воду</p>

<p>Красивая девушка блондинка, портретное фото, задний план в розовых оттенках сакуры, высокая детализация, реалистичный стиль</p>

<p>брюнетка держит на руках кота, повседневная обстановка, в квартире</p>

По умолчанию картинки генерируются в размере 768х768. В текстовом запросе можно указать параметры размера изображения, например:

морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, width: 1024, height: 768
лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, width: 1024, height: 1024

Разработчики добавили в бот отдельный режим, в котором можно увеличить изображение до 3072х3072.

Несмотря на серьезный прорыв нейросетей в генерации картинок, ряд проблем остаются нерешенными. Например, современный искусственный интеллект не очень хорошо справляется с отрисовкой человеческих глаз и конечностей. В боте TurboText эта проблема так же присутствует. Разработчики регулярно дообучают модель и нейросеть рисует все лучше и лучше.

Руки стали более четкими, визуально пропорциональными.

<p>This model is good at drawing background with CGI style, both urban and natural</p>

<p>Женское платье в рождественском стиле с рисунком снежинок, размер L, идеальная фигура 90-60-90</p>

<p>девушка стоит на фоне эйфелевой башни, смотря в камеру, улыбается</p>

Иногда нужно сделать несколько текстовых запросов, чтобы получить результат, где глаза и руки выглядят реалистично.

<p>блондинка за рулем шикарного автомобиля, крупный план, реалистичный стиль</p>

<p>Загарелый мужчина позирует на пляже, крупный план</p>

Для создания картинки достаточно ввести от 1 до 60 слов. Чтобы получить качественную картинку, отражающую вашу задумку, стоит внести больше деталей в текстовый запрос. Разработчики упростили эту задачу для пользователей и внедрили специальную команду для простой генерации запросов. Вводишь одну фразу или слово и получаешь три разных запроса, которые помогут создать детализированную картинку.

Примеры, какие запросы можно получить по одному слову:

Запрос: пожарная машина

Результат: пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение

Теперь посмотрим на разницу, если бы ввели обычный запрос «пожарная машина» и запрос, который создала нейросеть.

пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение

В разделе «Изображения» можно создать реалистичные картинки и аниме, создать запрос для генерации и увеличить изображение.

Нейросеть генерирует одно изображение от 10 до 20 секунд, в зависимости от заданного размера и сложности текстового запроса.

Спасибо за внимание к материалу:) Если остались вопросы по статье или по работе нейросети — пишите в комментариях.

#нейросети #turbotext #изображения

Отечественный AI-генератор картинок в Telegram от TurboText

Примеры картинок и запросов для генерации

Руки и глаза

Текстовые запросы

Как сгенерировать картинку