Как сгенерировать изображение с русским текстом в нейросети Sora
Адекватные надписи на кириллице пока даёт делать только OpenAI, у которой два детища – ChatGPT и Sora, в оба встроен новый продвинутый генератор изображений. Преимущество неоспоримое: теперь простым промтом можно создавать афиши, баннеры, карточки товаров, объявления и что там ещё придумало человечество.
Однако иногда происходит сбой матрицы и русские буквы заменяются на английские или теряется какая-то их часть (точки над "ё", знак над "й"). Происходит это непредсказуемо, но риски можно сократить.
Чтобы генерация с текстом получилась идеально, соблюдайте следующие правила:
- Промт пишите на английском языке. Хотя официально Sora поддерживает русский, но если в запросе есть текст на кириллице, то лучше разграничить куски запроса сразу.
- Заключайте текст, который должен быть на изображении, в кавычки: "такие" или «такие», или 'такие'.
- Оформляйте текст внутри промта как прямую речь, т.е. перед словами, которые вы хотите видеть на изображении, должно быть двоеточие, затем открывающая кавычка, после – закрывающая.
- Перед текстом или после указывайте, что он должен быть на русском языке – in Russian.
- Если хотите капслок, пишите в запросе текст заглавными буквами.
- Можно указать вид шрифта: с засечками, рукописный и т.д. По умолчанию нейросеть делает гротеск (шрифт без засечек).
Вот генерация с промтом полностью на русском языке:
Ошибки не критичны: потерял точки над [ё] и глаз у смайла, но зачем нам лишние хлопоты с их дорисовыванием? Смысл генерации с текстом в том, чтобы не подчищать потом за ИИ.
При увеличении количества текста или усложнении его структуры (заголовок, подзаголовок, подпись об изготовителе и т.д.) задача для нейросети усложняется и, соответственно, увеличивается риск получения буквенного месива.
Итак, суммируем. Вот пример промта для генерации изображения с текстом (кот с запиской):
make a warm, mesmerizing image, a cute red cat tilting his head, looking cheerful with a sly look, holding a piece of paper with effort with his teeth, on the piece of paper is a message in Russian: "Хватит сёрфить, наслаждайся жизнью :) Долистать до конца невозможно" Make it realistic, modern and three-dimensional, warm evening light, street, blurred background
Вот ещё примеры неудачных генераций для наглядности:
Промт на английском без кавычек и двоеточия:
Увидели склеенные [н] и [и] в слове [подними]? И смайл какой-то полуподмигивающий получился.
Промт на русском языке с капслоком:
Не считал текст большими буквами, первая [Х] заглавная, остальные большие физически, но по отношению к заглавной – строчные. Хотя тут я, наверное, придираюсь.
Если у вас есть подписка и нет ограничений на колич��ство генераций, задавать промт на русском тоже норм. Может выдать, например, три генерации отлично, а на четвёртой накосячить. Но ведь тогда можно запустить пятую, и продолжить вычитывать тексты :)