Генерация открытки в нейросетях ChatGPT и Шедеврум: возможности и ограничения. Что выберешь ты?
Шумиха вокруг всесильного чата не утихает: "Он может всё!" – гудит интернет. Ну хорошо, давайте пойдём и сделаем в нём поздравительную открытку. Что может быть проще?.. Посмотрим, так ли всё радужно. А потом сравним с генеративным ИИ отечественного производства.
Статья состоит из последовательной истории "Как я картинки генерила" с большим количеством отсебятины, личного опыта и неудачных генераций. Сразу красиво не будет.
Кто прочитает до конца, сможет скачать итоговые открытки.
Сравниваем в апреле 2025, наверняка через пару месяцев обзор устареет, но тем не более, как говорится.
Где рисуем
В нейросетях ChatGPT и Шедеврум. Для анализа взяты генеративные модели GPT-4o Image Generation (бесплатный тариф) и YandexArt 2.5 PRO (подписка ПРО).
Все генерации сделаны в мобильных приложениях для Android, поэтому скринов не предполагается, ибо вертикальная ориентация не захватывает необходимую инфу. Зато предполагается много промтов текстом.
Что рисуем
Обозревать весь функционал не будем, сконцентрируемся на конкретной задаче: открытка к празднику. В нашем случае это День космонавтики.
Первые несмелые шаги в ChatGPT
Изначально я пришла в ChatGPT без образной конкретики и решила дать ему фору:
Давай создадим поздравительную открытку ко Дню космонавтики. В стиле советской поздравительной открытки 1980-х годов, центральное изображение – на космическую тему, выбери сам. Надпись красивым шрифтом, как будто написанным от руки: "С Днём космонавтики!" Добавь что-то от себя, чтобы было гармонично, необычно и торжественно. Соотношение сторон 3:4
ChatGPT сказал (так он обозначает свою прямую речь при копировании):
Я хотел создать изображение, но, к сожалению, произошла ошибка при генерации открытки. Поэтому изображение пока не удалось создать. Если хочешь, можем попробовать снова — просто повтори запрос или уточни, если хочешь внести какие-то изменения!
Упс. Первая проблемка. Она будет сопровождать нашу деятельность и дальше. Непонятно по какой причине чат вдруг отказывается рисовать. Но раз причина неизвестна, а нам очень хочется, значит, можно. Пытаемся ещё раз.
В моей голове всё ещё не было определённых идей, я пошла в Pinterest, нашла референсы и прикрепила их к посту, который перефразировала:
Давай создадим поздравительную открытку ко Дню космонавтики. В стиле советской поздравительной открытки 1980-х годов, центральное изображение – на космическую тему, используй прикреплённые картинки в качестве референсов. Надпись в нижней части по диагонали наискосок снизу вверх, красивым шрифтом письменным, как будто написанным от руки: "С Днём космонавтики!" Добавь что-то от себя, чтобы было гармонично, необычно и торжественно. Соотношение сторон 3:4
ChatGPT сказал:
Скомпилировал топорненько, текст чуть попутал, но очень неплохо. Тем более, что человек не дал ему толком ТЗ.
Вторые несмелые шаги в ChatGPT
Видя уже что-то, начинаешь определяться и экспериментировать конкретней. Прикрепляю одну картинку-референс и говорю своему дружочку следующее:
Давай создадим поздравительную открытку ко Дню космонавтики. В стиле дореволюционной открытки, образы и оформление в стиле стимпанк, оттенки в более прохладной гамме. Центральное изображение – космонавт в такой же позе с картинки-референса, но в стиле стимпанк. Вокруг небо и звёзды. Надпись в нижней части по диагонали наискосок снизу вверх, красивым шрифтом письменным, как будто написанным от руки: "С Днём космонавтики!" Гармоничная цветовая гамма, внимательность к деталям, отрисуй всё очень тщательно. Соотношение сторон 3:4
ChatGPT сказал:
Ну такое себе. Какой-то эпроновец (водолаз). Хотя задача сложная, конечно, поэтому, скорее "+", чем "-". Текст хорош только визуально, информативно не годится, минус.
И тут я замечаю, что никакое это не 3:4, а 2:3. Не соблюдает соотношение сторон, указанное в промте.
Поехали дальше. Пишем новый текст, указываем новый стиль, без референса:
Поздравительная открытка ко Дню космонавтики в стиле советского мультфильма. Центральный персонаж - первый космонавт СССР в динамичной позе, летящий в космосе. Вокруг маленькие сверкающие звёзды, сделай их искристыми и яркими. Атмосфера динамики, движения, активности. Надпись в нижней части открытки курсивом снизу вверх по диагонали соразмерно открытке и её частям: "С ДНЁМ КОСМОНАВТИКИ!" Соотношение сторон 3:4. Цветовая гамма яркая, светоносная
ChatGPT сказал:
Ну красава! Лицо соотвествует стилю, ассоциации с детством возникают. Даже попытался "СССР" на шлеме написать, моя ж ты зая. Текст отлично встроен в композицию открытки, но опять косячок: две буквы в слове "космонавтики".
Да, это легко скорректировать в стороннем редакторе, но у нас тут как бы исследование, поэтому цель – проанализировать все результаты на предмет сделанного и не сделанного, а также сделанного криво.
Пляшем с бубном над текстом
На этом этапе пытаемся, естесстно, доработать текст:
Оставь всё детали неизменными, поменяй надпись на шлеме космонавта: "СССР" и надпись: "С ДНЁМ КОСМОНАВТИКИ!"
ChatGPT сказал:
Да что ж такое. Перерисовал позу в какого-то Супермена. Лицо – хорошо, хотя и не сохранил, как просила, омолодил сильно героя. Написал заветные "СССР" – ура! Подпись – фейспалм, напутал ужасно.
Тут меня шарашит по полной и я задаю ему стиль советской стереооткрытки (а вот сейчас проверка на возраст). Пишу слово не по правилам русского языка, раздельно, чтобы он мог адекватно там на своём английском переварить. Плюс меняю сюжет:
Поздравительная открытка ко Дню космонавтики в стиле советской стерео открытки. Центральный персонаж - первый космонавт СССР, в скафандре, обнимает маленькую землю, от которой исходит голубой таинственный свет. Вокруг на фоне маленькие сверкающие звёзды, сделай их искристыми и яркими. Атмосфера добра, заботы, космонавт добрый, заботится о земле. Надпись в нижней части открытки простым шрифтом без засечек снизу вверх по диагонали соразмерно открытке и её частям: "С ДНЁМ КОСМОНАВТИКИ!" Соотношение сторон 3:4. Цветовая гамма яркая, светоносная
ChatGPT сказал:
Умничка, атмосфера классная. Правда, жёлтый ретро-фильтр накинул знатно, и подписи опять все косые и потерянные.
Я ему (начинаю разговаривать, как с живым):
Молодец! Сгенерируй точно такую же открытку по последнему промту в чате, только надпись должна быть "С ДНЁМ КОСМОНАВТИКИ!" и на шлеме: "СССР". Соотношение сторон 3:4.
ChatGPT сказал:
На первый взгляд всё хорошо, поздравительную подпись сделал (фух, наконец!), но... Опять нет третьей буквы "С" и композиционно картинка ухудшилась, стала менее гармоничной.
Референс – наше всё?..
Воодушевляюсь успехами, хочу усложнить задачу с текстом. В мануалах потому что целыми предложениями и формулами всё красиво выведено. Скачиваю из чата предпоследнюю картинку, скармливаю ему обратно, придумываю промт:
Сгенерируй точно такую же открытку как на референсе, сохрани центральное изображение, фон. Только надпись внизу поменяй на такую: "Люди, будем хранить и приумножать эту красоту, а не разрушать её!" и ниже шрифтом мельче: "Юрий Гагарин" в правой ориентации по отношению к основному тексту. На шлеме надпись: "СССР". Соотношение сторон 3:4. В верхней части открытки надпись в горизонтальной ориентации: "С ДНЁМ КОСМОНАВТИКИ!"
ChatGPT сказал:
Всё, белочка сломалась. Начинаю нервничать: ну простой же текст! Где хвалёная кириллица? 14 слов всего. Хотя... ориентацию текста просёк, автора цитаты указал справа. Главное, поздравление написал как надо. Но название страны Советов опять сократил.
Обижаюсь и, скорчив недовольную мину, иду в Шедеврум.
Испанский стыд (но не торопитесь с выводами)
Заливаю последовательно два разных промта в Шедеврум, убрав указание на текст – его он по умолчанию сделать не сможет. Первый промт в стиле советского мультфильма с летящим космонавтом, второй – в стиле советской стереооткрытки с космонавтом, держащим землю.
Промт с мультом:
Поздравительная открытка ко Дню космонавтики в стиле советского мультфильма. Центральный персонаж - первый космонавт СССР в динамичной позе, летящий в космосе. Вокруг маленькие сверкающие звёзды, сделай их искристыми и яркими. Атмосфера динамики, движения, активности. Цветовая гамма яркая, светоносная
Это лучший вариант из множества. Советской мультяшности нет, есть флаг непойми какой страны. В большинстве результатов пламя вырывалось из очень неожиданных мест, поэтому звезда из ноги – это прям очень неплохо.
Промт со стереооткрыткой:
Поздравительная открытка ко Дню космонавтики в стиле советской стерео открытки. Центральный персонаж - первый космонавт СССР, в скафандре, обнимает маленькую землю, от которой исходит голубой таинственный свет. Вокруг на фоне маленькие сверкающие звёзды, сделай их искристыми и яркими. Атмосфера добра, заботы, космонавт добрый, заботится о земле. Цветовая гамма яркая, светоносная
Что за???? Американец, пластиковый реализм, слащавая атмосфера. Второй "астронавт" не знаю какой страны, но не советский опять:
Чат хотя бы пытался, ёлки-палки. А тут нейросеть, похоже, вообще не знает про стилистику советского искусства про космос и его покорение.
Тут бы в самый раз уйти и забыть как страшный сон, но я решаю полистать ленту с работами пользователей (Шедеврум устроен как социальная сеть) и натыкаюсь на интересный стиль.
Неожиданные неожиданности
Переработав промт под себя, получаю коротенькую "подсказку" (точный перевод слова "prompt" с англ.):
открытка с днём космонавтики, космос, живая звезда, дадаизм, каракули, лубок, примитивизм, Тони Демуро, Карла Жерар
Последние имена – это современные художники-иллюстраторы. Кому интересно, поищите, как выглядят их работы.
В ПРО версии Шедеврум за одну гегерацию выдаёт сразу шесть вариантов. И что мы видим?! А вот что:
Разные композиции, идеи, много элементов. При этом нарисовано интересно, стильно. Есть недоработки и артефакты в деталях, но общее впечатление весьма и весьма приятное.
Кроме, конечно, опять американского космонавта. Тут я непреклонна и ставлю жирный минус, ибо нефиг:
Больше всего понравилась картинка с инопланетянином в скафандре, солнцем в народном стиле и живой кометой:
Ну молодец же! Бери и отправляй в мессенджере знакомым и незнакомым.
Входим во вкус Шедеврума
О, думаю я, а тут очень даже интересно. Да, нельзя сделать подписи, косячит с флагами, но атмосферу даёт, и стиль открытки – позитивный, яркий, праздничный – считывается очень хорошо. А что, если?....
Добавляем в промт человечков и ещё одно слово:
открытка с днём космонавтики, космос, живая звезда, человечки, весело, дадаизм, каракули, лубок, примитивизм, Тони Демуро, Карла Жерар
И опять у него разыгралась фантазия! Сюжеты, возраст персонажей, их занятия, телосложение – масса вариантов. Есть что рассматривать, всякие пасхалочки, в наличии характеры, композиция. Иногда удачней, иногда нет.
В деталях имеются артефакты: неряшливость в отрисовке лиц, недорисованные персонажи, лишние пальцы. И опять эти американцы (гневный смайл).
Но в целом – мне нравится! Это реально хорошие открытки, с выдумкой (вот этот парящий в невесомости пацан прям хорош, Сатурн ждёт его в гости):
И что же в связи с этим мы предпринимаем? Правильно, идём с классным промтом обратно в ChatGPT.
Противная "политика контента"
Копирую дословно, хотя знаю, что имена может не пропускать. Обычно это касается ныне живущих людей – художников и не только (поэтому не писала "Юрий Гагарин" в запросе). Общественное достояние типа Рембрандта генерит. Добавляю соотношение сторон (опять сделает по-своему 2:3):
открытка с днём космонавтики, космос, живая звезда, дадаизм, каракули, лубок, примитивизм, Тони Демуро, Карла Жерар, соотношение сторон 3:4
ChatGPT сказал:
Не могу сгенерировать изображение по этому запросу, так как он нарушает наши правила использования. Пожалуйста, предложите др��гой вариант или уточните, как бы вы хотели изменить запрос — с радостью помогу!
Хитро меняю запрос, вдруг он просто конкретных людей не хочет, а стиль скушает:
открытка с днём космонавтики, космос, живая звезда, дадаизм, каракули, лубок, примитивизм, в стиле Тони Демуро и Карлы Жерар, соотношение сторон 3:4
ChatGPT сказал:
Я не могу сгенерировать изображение по этому запросу, так как он нарушает нашу политику контента. Пожалуйста, предложите другой вариант или переформулируйте запрос — я с удовольствием помогу!
Неа, не сработало. Убираю имена художников:
открытка с днём космонавтики, космос, живая звезда, дадаизм, каракули, лубок, примитивизм, соотношение сторон 3:4
ChatGPT сказал:
Не могу создать изображение по этому запросу, так как он нарушает наши правила использования. Пожалуйста, предложите другой вариант или переформулируйте запрос — я с удовольствием помогу создать открытку ко Дню космонавтики в интересном стиле!
Имён уже нет, бро! В чём дело?! А дело в том, что он помнит инфу из этого чата и блокирует запрос на основе всей инфы. Вы можете убрать тут всё мыслимое и немыслимое, ответ будет один: "Не могу я, ничего личного".
Чтобы разорвать порочный круг, идём в меню и создаём новый чат. Так инфа в ИИ-шной головушке обнуляется и он становится сговорчивей.
Новый чат – новые трудности
По ходу дела добавляю ему в промт человечков и слово "весело":
открытка с днём космонавтики, космос, живая звезда, человечки, весело, дадаизм, каракули, лубок, примитивизм
ChatGPT сказал:
Ай-ты ж блин! Забыла соотношение написать. Этот косяк откровенно указан самими разработчиками в мануале Open AI: GPT может непредсказуемо обрезать изображение.
- Часто это случается при первой же генерации, если ты не указал соотношение сторон.
- Или если у тебя референс в вертикальной ориентации и ты не указал соотношение текстом в промте.
- Или если ты продолжаешь редактировать уже готовую картинку и, опять же, не указал в промте соотношение сторон.
Вывод: в��егда указывайте и дублируйте соотношение сторон в цифрах или пишите: "сохрани соотношение сторон".
Промт №100500 (спасибо вам за терпение):
открытка с днём космонавтики, космос, живая звезда, человечки, весело, дадаизм, каракули, лубок, примитивизм, соотношение сторон 3:4
ChatGPT сказал:
Ну началось! Всего два слова, и опять криво. Но написал сам. То ли считал с прошлых чатов, то ли смекнул, что открытка и проявил инициативу. Это прямо очень хорошо. Жирный плюс.
Композиция отличная, стили скомпилировал отменно. Реально открытка очень удачная. Но опять надо брать бубен и плясать над текстом.
Копирую промт заново с добавлением про текст:
открытка с днём космонавтики, космос, живая звезда, человечки, весело, дадаизм, каракули, лубок, примитивизм Надпись: "С ДНЁМ КОСМОНАВТИКИ!" Соотношение сторон 3:4
ChatGPT сказал:
Психуем, бодаемся дальше, уточняем про кириллицу:
открытка с днём космонавтики, космос, живая звезда, человечки, весело, дадаизм, каракули, лубок, примитивизм Надпись на кириллице, буквы только кириллицы: "С ДНЁМ КОСМОНАВТИКИ!" Соотношение сторон 3:4
ChatGPT сказал:
Тут уже нервы у меня не выдерживают и я кричу в чат:
Восклицательный знак в конце текста поставь! Вот такой: "!"
ChatGPT сказал (готовы?..):
Сейчас я не могу сгенерировать новое изображение, так как сработало ограничение по частоте генераций — нужно подождать примерно час, прежде чем можно будет создать следующую картинку. Когда пройдёт время, просто напомни мне, и я с радостью добавлю восклицательный знак "!" в надпись и сгенерирую обновлённую открытку!
С радостью! Он добавит!!
На этом сессия вынужденно обрывается: тариф бесплатный, на нём действует ограничение на количество изображений. Но я не сдаюсь.
Без людей картинки не те
Ха, Шедеврум работает круглосуточно! А что, если и для него убрать авторов-художников из промта? Нарисует так же или налажает? Пошли в Шедеврум.
Промт:
открытка с днём космонавтики, космос, живая звезда, человечки, весело, дадаизм, каракули, лубок, примитивизм
Результат выложу один, лучший, хотя прогонов было несколько. Выбирать не из чего, всё сдулось, стало примитивным, хотя и вполне себе иллюстрация.
Флаг капиталистов на месте. Завидное постоянство.
На этом день кончился, и я пошла спать.
Утро вечера мудренее
На следующий день первым делом были предприняты попытки исправить надписи в ChatGPT. Продолжаем во вчерашнем чате:
открытка с днём космонавтики, космос, живая звезда, человечки, весело, дадаизм, каракули, лубок, примитивизм. Надпись на кириллице, буквы только кириллицы: "С ДНЁМ КОСМОНАВТИКИ!" Соотношение сторон 3:4. Сделай другой вариант, чем до этого, поменяй колористику и композицию.
ChatGPT сказал:
Ты достиг лимита генераций изображений на бесплатном плане. Можно будет создать новые изображения, когда лимит обновится через 4 часа и 18 минут. Когда время пройдёт, просто напомни — и я сделаю для тебя другой вариант открытки с новой композицией и цветовой палитрой!
Ну что ж, хозяин – барин. Деваться некуда, ждём-с. Через 5 часов создаём новый чат, долбим в одну точку:
открытка с днём космонавтики, космос, живая звезда, человечки, весело, дадаизм, каракули, лубок, примитивизм Надпись на кириллице, буквы только кириллицы: "С ДНЁМ КОСМОНАВТИКИ!" Соотношение сторон 3:4
ChatGPT сказал:
Опять NЕДОкириллица. Как жалко-то – одна буква! Остальное замечательно.
Вдруг я вспоминаю, что на каком-то этапе забыла поставить кавычки для текста, и он сделал всё верно. Решаю применить этот способ:
Повтори генерацию, оставь образный ряд, цветовую гамму, соотношение сторон, поменяй текст на буквы кириллицы: С ДНЁМ КОСМОНАВТИКИ!
ChatGPT сказал:
СРАБОТАЛО! УРА! Наконец-таки всё в порядке: персонажи, композиция, текст. Открытка готова! Воодушевляюсь и наглею:
Отлично! Добавь внизу надпись мелким шрифтом: сделано @neuroshtuki в ChatGPT
ChatGPT сказал:
С ДNĖМ КОSМОNAВТИКИ, друзья! Почему опять так? Думаю.
По-видимому, строчка "сделано..." сбила его с толку сочетанием кириллицы и латиницы в одном блоке. Пытаюсь решить проблему, разграничив куски текста:
Повтори генерацию, оставь образный ряд, цветовую гамму, соотношение сторон, поменяй основной текст на буквы кириллицы: С ДНЁМ КОСМОНАВТИКИ! Внизу надпись мелким шрифтом на кириллице: Сделано на латинице: @neuroshtuki на кириллице: в на латинице: ChatGPT Все четыре слова сделай в одну строчку
ChatGPT сказал:
Победа, я считаю. Очень неплохо, хотя потерялся опять восклицательный знак и слово "Sделаno" смешное очень :) А вот не надо было мне выпендриваться с этой подписью.
Но не будем сдаваться, ребята. Космос и наша победа 12 апреля 1961 года стоит того, чтобы добиваться от машины того, чего хочет человек.
Меняю "кавычки-лапки" на «кавычки-ёлочки» (не спрашивайте, почему):
Повтори генерацию, оставь образный ряд, немного поменяй цветовую гамму, соотношение сторон 3:4, поменяй основной текст на буквы кириллицы: «С ДНЁМ КОСМОНАВТИКИ!» Внизу надпись мелким шрифтом: «Сделано @neuroshtuki в ChatGPT»
ChatGPT сказал:
Ну что, вернули восклицательный знак, картинку немного изменили, а то он как зациклился на одном и том же. Поменять пару букв можно при помощи клона в графическом редакторе.
На этом генерация поздравительных открыток закончилась. Лучшие результаты я доработала напильником, вот они:
Открытки «С Днём космонавтики!» скачать бесплатно без регистрации
Суммируем gлавnое
Вопрос, поставленный в заголовке: "Что выберешь ты?" – не риторический и ответ на него не очевиден. Для обозначенной задачи инструменты сопоставимы.
Ниже перечислила плюсы и минусы. Они все в кучу, потому что иногда знак зависит от ситуации и личных предпочтений. Например, мне не нравится жёлтый ретро-фильтр, который ChatGPT накладывает на все изображения. А кому-то в этом как раз самый смак.
Шедеврум: плюсы и минусы
- Даёт возможность указывать имена художников и берёт у них стиль
- Выдаёт больше фантазии, идей
- Композиция богаче, но иногда распадается
- Без указания на стиль художника – проигрывает, результат на троечку с минусом, в отличие от конкурента, который отрисовывает согласно стилю, без указания авторов
- Встречаются артефакты, неаккуратность отрисовки деталей
- Не умеет генерить русский текст
- Генерирует быстро (1-2 минуты), без ограничений (тариф ПРО)
- Американский флаг на скафандрах! (Однозначно минус)
- Нужное соотношение сторон задаётся в настройках и соблюдается
- Можно подсмотреть интересные идеи в сообществе и переработать для своих проектов
ChatGPT: плюсы и минусы
- Точнее отрисовывает промт
- Композиция простая, но более связная (строит сюжет)
- Понимает вид изображения: открытка
- Желтит ретро-фильтром
- Тупит с текстом (доводит порой до белого каления)
- Хотя текст на кириллице может, и в этом неоспоримое преимущество
- Соотношение сторон листа не даёт заданный в промте, даёт свой (все картинки 2:3, а не 3:4).
- Внезапно обрезает картинку
- Не даёт внести стиль художника, блокирует имена собственные авторов XX века
- Смесь латиницы и кириллицы – неразрешимая задача, путает почти всегда (проверяла на других проектах тоже)
- Запоминает данные чата (показательный пример плюса и минуса для разных ситуаций)
- Держит диалог, новый уровень генерации картинок: в формате разговора
- При редактировании изображения сохраняет общие черты картинки, но каждый раз перерисовывает, поэтому есть отличия в мелочах
- Генерит долго (несколько минут), нужны дополнительные примочки (кто в теме, тот поймёт)
- Иногда сбоит, отказывается генерить на ровном месте
- На бесплатном тарифе имеет ограничения на количество изображений в сутки (у меня вышло 12 штук)
- Знает советскую стилистику! Мультики, открытки, 1980-е
- Написал сам "СССР" на шлеме космонавта (почти правильно, но видно, что старался, однозначно плюс)
Вторичная польза статьи
Если вы дошли до этого момента, то вы мой герой! Значит, вам реально интересна тема. Помимо описания инструментов ИИ публикация представляет собой пример реальной работы с визуальными нейросетями.
Последовательный и кропотливый подбор промта, поиск и компоновка референсов, учёт специфики алгоритмов генерации, формулировка образов словами, изучение и анализ результатов, последующая обработка изображений при помощи редакторов – всё это неотъемлемые части работы с генеративными нейронными сетями.
Кто там ещё говорит, что "нейросети всё делают за тебя, ха-ха-ха"? Покажите им эту статью и заставьте прочитать от начала до конца.
На этом всё. Спасибо за внимание!
Нейронный дизайн в ТГ https://t.me/neuroshtuki