Соотношение сторон и размеры в Midjourney
Что такое соотношение сторон?
Соотношение сторон или “aspect ratio” — это пропорциональное отношение ширины изображения к высоте. То есть, соотношение сторон 16 к 9 значит, что то число (пикселей, сантиметров или дюймов), которое помещается в ширину кадра ровно 16 раз, поместится в высоту кадра ровно 9 раз.
Единицы измерения в данном случае не важны, поэтому отношение называется «пропорциональным».
Соотношение сторон сохраняется, когда вы увеличиваете изображение, а размер конечного изображения в пикселях зависит от выбранного в настройках режима апскейла.
Как узнать соотношение сторон?
Метод читера: бот Midjourney умеет описывать картинки с помощью команды "/describe". Пишете команду, загружаете картинку: в ответном сообщении бот расскажет о том, что изображено на картинке, а в конце допишет параметр "--ar". После этого параметра и будет стоять соотношение сторон закруженной картинки.
Чтобы найти соотношение сторон самостоятельно, нужно разделить ширину и высоту изображения на их наибольший общий делитель. А чтобы найти их наибольший общий делитель (НОД) можно воспользовться алгоритмом Евклида.
Как задать соотношение сторон в Midjourney?
По умолчанию Midjourney создает изображения с соотношением сторон 1:1. Размер таких картинок в гриде для четвертой модели — 512 × 512 пикселей.
Если вы хотите изменить соотношение сторон, вы можете добавить в запрос параметр "--aspect" или "--ar" (aspect ratio), после которого через пробел указать нужное, например, "--ar 3:2". Не забывайте, что параметры пишутся в самом конце запроса:
Какими бывают соотношения сторон в Midjourney
С недавнего времени Midjourney v4 и Niji поддерживают любые соотношения сторон, при условии, что ни одна из сторон не будет отличаться от другой больше, чем в два раза. При этом размер изображения будет «округляться» до ближайших 32 пикселей.
То есть, запрос с "--ar 18:10" действительно сгенерирует сетку из четырёх изображений 928 × 512, а вот запрос с параметром "--ar 2.39:1" выдаст ошибку:
Custom aspect ratios taller than 1:2 or wider than 2:1 are not supported for --version 4
Из-за округления до 32 пикселей картинка 928 × 512 получилась 18.125 к 10, а не 18 к 10, как было указано в параметре "--ar". Подобное округление существует и в третьей модели Midjourney.
Округление работает так: допустим, вы хотите создать картинку с соотношением сторон 33 к 20. После всех увеличений, вы получите картинку с высотой 1024 пикселя. Для того, чтобы картинка соответствовала соотношению 33:20, её ширина должна быть 1689.6 пикселя. Миджорни округлит эту ширину до ближайшего числа, которое без остатка делится на 32. В нашем случае картинка получится 1696 × 1024.
💡 В альфа-тестировании пятой модели нет ограничений на соотношение сторон: можно создавать изображения с соотношением сторон, например, 100 к 1
Примеры соотношений сторон
Дальше перечислены примеры привычных соотношений сторон. Но не забывайте, что правила созданы для того, чтобы их нарушать, особенно когда это касается творчества.
1:1
От Малевича до инстаграма. Квадрат – один из самых распространенных форматов.
В четвёртой версии при генерации сетки вы получите 4 картинки 512 × 512 пикселей, если увеличите одну из них кнопкой U1-U4 с включенной настройкой “Light upscale” или “Regular upscale” — 1024 × 1024. “Beta upscale” увеличит картинку до 2048 × 2048 пикселей.
16:9 и 9:16
Формат видео, можно генерировать обложки, пекшоты и титры для видео. Примерно соответствует соотношению сторон экранов смартфонов четырехлетней давности.
Размер картинки 9:16 в сетке 512 × 896, “Light & Regular upscale” — 960 × 1664, “Beta upscale” — 1536 × 2668 пикселей.
3:2 и 2:3
Классика фотографии, унаследованная ещё от плёночных фотоаппаратов:
- Бумажные фотографии 15 × 10 (3:2)
- Кадр кассетной плёнки 36 × 24 мм (3:2)
- Размер полноразмерной матрицы современного фотоаппарата 36 × 24 мм (3:2)
- Соотношение сторон 3:2 у кропнутой матрицы любительских зеркалок
Размер картинки в сетке 512 × 768, “Light & Regular upscale” — 1024 × 1536, “Beta upscale” — 1664 × 2432 пикселей.
2:1 и 1:2
Широкий кадр, можно использовать для панорам или наоборот, портретов в полный рост. Неплохо подходит для обложки профиля в соцсети.
Один к двум – примерное соотношение сторон экрана нового смартфона, а значит хорошо подходит для того, чтобы генерировать обои на телефон. Очень близок к киношному 2.39:1
Размер картинки в сетке 512 × 1024, “Light & Regular upscale” — 864 × 1728, “Beta upscale” — 1408 × 2816 пикселей.
А лучшее обучение — это практика, поэтому каждый день мы тренируемся на котиках. Смотреть на это можно в нашем кошачьем канале. Всем добра и валерьяны за наш счёт!
Дальше можно почитать
Связанные статьи
Источники
Sergei Klimenko