Отечественный AI-генератор картинок в Telegram от TurboText
Midjourney, DALL-E 2, Jasper Art — генераторы изображений, о которых в 2022 году услышал практический каждый, кто интересуется нейросетями или занимается контентом.
Российские программисты внедрили нейросети для генерации изображений прямо в Telegram — TurboText_bot. Также есть англоязычный бот с тем же набором функций.
Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.
Нейросеть TurboText генерирует реалистичные картинки и аниме, придумывает расширенные текстовые запросы для создания хорошего изображения и увеличивает размер картинки до 3072х3072.
Примеры картинок и запросов для генерации
Реализм
Мужчина десантник в голубой футболке в белую полоску
Cute Millie Bobby Brown, Eleven from "stranger things", monochrome, portrait photo, 35 mm, width: 1024, height: 1024
Human Heart Made of Fruits and Vegetables
мультяшная милая панда профессор сидит в школьном классе и читает книгу
роскошные розовые пионы
Аниме
store full of curious collectibles :: incredible, anime, Digital 2D, animated by Kyoto Animation, Studio Ghibli, Miyazaki, AKIRA art style, beautiful, gorgeous, dramatic lighting
красивая девушка в кожаном платье, русые волосы и зеленые глаза с черным футуристическим автомобилем реалистично 3d визуализация высокого качества
самое красивое произведение абстрактного искусства из когда-либо созданных, смешанная техника, пастельные тона, померанский шпиц, дерево, листья, цветы, капля чернил в воду
Красивая девушка блондинка, портретное фото, задний план в розовых оттенках сакуры, высокая детализация, реалистичный стиль
брюнетка держит на руках кота, повседневная обстановка, в квартире
милый котик гуляет по лесу
По умолчанию картинки генерируются в размере 768х768. В текстовом запросе можно указать параметры размера изображения, например:
- морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, width: 1024, height: 768
- лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, width: 1024, height: 1024
Разработчики добавили в бот отдельный режим, в котором можно увеличить изображение до 3072х3072.
Руки и глаза
Несмотря на серьезный прорыв нейросетей в генерации картинок, ряд проблем остаются нерешенными. Например, современный искусственный интеллект не очень хорошо справляется с отрисовкой человеческих глаз и конечностей. В боте TurboText эта проблема так же присутствует. Разработчики регулярно дообучают модель и нейросеть рисует все лучше и лучше.
Руки стали более четкими, визуально пропорциональными.
This model is good at drawing background with CGI style, both urban and natural
Женское платье в рождественском стиле с рисунком снежинок, размер L, идеальная фигура 90-60-90
девушка стоит на фоне эйфелевой башни, смотря в камеру, улыбается
Иногда нужно сделать несколько текстовых запросов, чтобы получить результат, где глаза и руки выглядят реалистично.
блондинка за рулем шикарного автомобиля, крупный план, реалистичный стиль
Загарелый мужчина позирует на пляже, крупный план
Текстовые запросы
Для создания картинки достаточно ввести от 1 до 60 слов. Чтобы получить качественную картинку, отражающую вашу задумку, стоит внести больше деталей в текстовый запрос. Разработчики упростили эту задачу для пользователей и внедрили специальную команду для простой генерации запросов. Вводишь одну фразу или слово и получаешь три разных запроса, которые помогут создать детализированную картинку.
Примеры, какие запросы можно получить по одному слову:
Запрос: пожарная машина
Результат: пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение
Теперь посмотрим на разницу, если бы ввели обычный запрос «пожарная машина» и запрос, который создала нейросеть.
Как сгенерировать картинку
В разделе «Изображения» можно создать реалистичные картинки и аниме, создать запрос для генерации и увеличить изображение.
Нейросеть генерирует одно изображение от 10 до 20 секунд, в зависимости от заданного размера и сложности текстового запроса.
Спасибо за внимание к материалу:) Если остались вопросы по статье или по работе нейросети — пишите в комментариях.
Крутая новость и теперь число качественно оформленных материалов на вц точно возрастёт 🤘
По традиции оставлю тут ссылочку на чат для всех, кто внедряет ИИ и нейросети в свою работу и жизнь — https://t.me/+MdZUKTUEFbMwM2Zi. Уже более 600 человек, будем рады новичкам 🙌
Сделали сборку свою и теперь это "Отечественный AI генератор"?
Тьфу на вас.
Вот тоже не понял что тут нового. Запросы к Stable Diffusion через бота в телеге сделали, вот и всё 🧐
Здравствуйте) Бот работае на основе архитектуры Stable Diffusion, мы этого не скрываем. НО. Мы самостоятельно обучали нейросеть на генерацию качественных изображений, работаем над ней ежедневно.
помимо изображений у нас есть собственные разработки для генерации контента и проверки качества текста, над которыми мы также интенсивно работаем.
В любом случае, спасибо за интерес к материалу и сервису
"Отечественный" - потому что у них отечество американское.
Вон, даже запросы делают на нашем, американском языке