Как сгенерировать изображение с русским текстом в нейросети Sora

Адекватные надписи на кириллице пока даёт делать только OpenAI, у которой два детища – ChatGPT и Sora, в оба встроен новый продвинутый генератор изображений. Преимущество неоспоримое: теперь простым промтом можно создавать афиши, баннеры, карточки товаров, объявления и что там ещё придумало человечество.

Удачный результат генерации в Sora
Удачный результат генерации в Sora

Однако иногда происходит сбой матрицы и русские буквы заменяются на английские или теряется какая-то их часть (точки над "ё", знак над "й"). Происходит это непредсказуемо, но риски можно сократить.

Чтобы генерация с текстом получилась идеально, соблюдайте следующие правила:

  1. Промт пишите на английском языке. Хотя официально Sora поддерживает русский, но если в запросе есть текст на кириллице, то лучше разграничить куски запроса сразу.
  2. Заключайте текст, который должен быть на изображении, в кавычки: "такие" или «такие», или 'такие'.
  3. Оформляйте текст внутри промта как прямую речь, т.е. перед словами, которые вы хотите видеть на изображении, должно быть двоеточие, затем открывающая кавычка, после – закрывающая.
  4. Перед текстом или после указывайте, что он должен быть на русском языке – in Russian.
  5. Если хотите капслок, пишите в запросе текст заглавными буквами.
  6. Можно указать вид шрифта: с засечками, рукописный и т.д. По умолчанию нейросеть делает гротеск (шрифт без засечек).

Вот генерация с промтом полностью на русском языке:

Неудачный результат генерации в Sora
Неудачный результат генерации в Sora

Ошибки не критичны: потерял точки над [ё] и глаз у смайла, но зачем нам лишние хлопоты с их дорисовыванием? Смысл генерации с текстом в том, чтобы не подчищать потом за ИИ.

При увеличении количества текста или усложнении его структуры (заголовок, подзаголовок, подпись об изготовителе и т.д.) задача для нейросети усложняется и, соответственно, увеличивается риск получения буквенного месива.

Итак, суммируем. Вот пример промта для генерации изображения с текстом (кот с запиской):

make a warm, mesmerizing image, a cute red cat tilting his head, looking cheerful with a sly look, holding a piece of paper with effort with his teeth, on the piece of paper is a message in Russian: "Хватит сёрфить, наслаждайся жизнью :) Долистать до конца невозможно" Make it realistic, modern and three-dimensional, warm evening light, street, blurred background

Вот ещё примеры неудачных генераций для наглядности:

Промт на английском без кавычек и двоеточия:

Неудачный результат генерации в Sora
Неудачный результат генерации в Sora

Увидели склеенные [н] и [и] в слове [подними]? И смайл какой-то полуподмигивающий получился.

Промт на русском языке с капслоком:

Условно неудачный результат генерации в Sora
Условно неудачный результат генерации в Sora

Не считал текст большими буквами, первая [Х] заглавная, остальные большие физически, но по отношению к заглавной – строчные. Хотя тут я, наверное, придираюсь.

Если у вас есть подписка и нет ограничений на колич��ство генераций, задавать промт на русском тоже норм. Может выдать, например, три генерации отлично, а на четвёртой накосячить. Но ведь тогда можно запустить пятую, и продолжить вычитывать тексты :)

Нейронный дизайн в ТГ https://t.me/neuroshtuki

Голографический котик ждёт ваших ваших комментариев и ♥
Голографический котик ждёт ваших ваших комментариев и ♥
4
Начать дискуссию