Полное руководство по MidJourney V5.1 (с изображениями и подсказками!)
Если вы жили не в пещере, то трудно не заметить безумно быстрые темпы развития ИИ. Еще в середине марта мой любимый генератор искусственного интеллекта для преобразования текста в изображения — MidJourney анонсировал новую версию 5 (V5), и многие пользователи, включая меня, получили удовольствие от потрясающего гиперреалистичного цифрового искусства , которое он может генерировать. Всего через 1,5 месяца, 3 мая, внезапно из ниоткуда, MidJourney сделал новое объявление о том, что версия 5.1 (V5.1) теперь официально доступна с еще более улучшенными функциями. Ух ты! Это заставляет меня задуматься, а брала ли команда MidJourney когда-нибудь выходной?! Если вы так же взволнованы, как и я, давайте вместе изучим новый MidJourney V5.1!
Как начать использовать Midjourney V5.1?
Если вы никогда раньше не использовали MidJourney, то самое время начать)) А если вам нужен подробный гайд, как юзать эту нейросеть - пиши об этом в комментариях ;)
Для тех из вас, кто в настоящее время является пользователем MidJourney, есть способ начать использовать V5.1.
Вы можете ввести « /settings » и выбрать « MJ Version 5.1 »:
После этого все готово, и вы можете начать подсказку с V5.1! Вы можете следовать тем же инструкциям, чтобы переключиться на другие версии (V1/V2/V3/V4/V5) в любое время. И использовать любую подсказку с помощью команды « /imagine prompt ваша подсказка »
Что нового в версии 5.1? (Плюс сравнение изображений, созданных V5 и V5.1)
Давайте сначала немного расскажем о последней версии, V5.
V5 — это вторая модель MidJourney, обученная на суперкластере искусственного интеллекта, который использует значительно отличающиеся нейронные архитектуры и новые эстетические методы и находится в разработке уже 5 месяцев.
По словам команды MidJourney, когда они запустили V5 еще в марте, V5 не был последним шагом, и «он будет только продвигаться к чему-то лучшему и большему в силе коллективного человеческого воображения». А вот и «нечто лучшее и большее» — V5.1.
В версии 5.1 есть несколько основных новых функций:1. Версия 5.1 отлично подходит для коротких и «теоретических» подсказок.
Мы уже знаем, что V5 чрезвычайно отзывчив на подсказки пользователей. Очень короткие подсказки могут не совсем хорошо работать с V5, поэтому рекомендуется вводить более длинные и подробные описания при создании изображений с помощью V5.
Однако с MidJourney V5.1 теперь вы снова можете «лениться» с короткими подсказками — поскольку V5.1 воспользуется своим творческим потенциалом, чтобы заполнить пробел за вас.
Мало того, теперь вы можете подсказывать более «теоретическим» текстом или даже строкой стихотворения, а MidJourney V5.1 удивит вас своей креативностью!
Давайте взглянем на следующие два примера, сравнивая V5 и V5.1, и как они реагируют на короткие и теоретические подсказки.
Пример 1 — Используемая подсказка:
Love (Любовь)
V5:
V5.1:
Пример 2 — Используемая подсказка:
The beginning of an end (Начало конца)
V5:
V5.1:
2. Версия 5.1 НАМНОГО более «уверенная»
В V5.1 вы обнаружите, что изображения гораздо более «художественные» и «творческие», чем в V5 . В то время как V5 хорошо известен своим реализмом, V5.1 имеет более художественный подход к изображениям, которые он создает, и изображения, как правило, более эстетичны, если не сказать больше.
Для версии 5.1 существует «неутвержденный» режим (аналогичный режиму по умолчанию для версии 5), который называется «Режим RAW» и по-прежнему сохраняет «художественный» стиль версии 5.1. Вы можете создать изображения в режиме RAW, набрав « /settings » и выбрав « Режим RAW ».
Давайте взглянем на следующие 2 примера, сравнивая V5 и V5.1 на уровне их «мнений»:
Пример 1 — Используемая подсказка:
A journey alone (Путешествие в одиночку)
V5:
V5.1:
Пример 2 — Используемая подсказка:
When Donald Trump becomes a robot (Когда Дональд Трамп станет роботом)
V5:
V5.1:
3. Более высокая согласованность и большая точность текстовых подсказок
Согласно документации MidJourney, "Когерентность — это сила связи между текстовой подсказкой и результирующим изображением. Высокая степень согласованности означает, что изображение будет точным представлением текста подсказки".
Давайте взглянем на следующие 3 примера, сравнивая V5 и V5.1 по их уровню согласованности.
Пример 1 — Используемая подсказка:
When cats rule the world (Когда коты правят миром)
V5:
V5.1:
Пример 2 — Используемая подсказка:
Architecture drawing of a robot monstera (Архитектурный чертеж робота монстера)
V5:
V5.1:
Пример 2 — Используемая подсказка:
Hong Kong in the palm of my hand (Гонконг как на ладони)
V5:
V5.1:
4. Меньше нежелательных границ или текстовых артефактов
Одна из тех немногих вещей, которые больше всего беспокоят меня в изображениях, которые MidJourney генерирует в предыдущих версиях, — это случайные нежелательные границы или текстовые артефакты. 🤬
Я уверен, что вы тоже чувствовали эту боль. Хорошей новостью является то, что эта проблема теперь настолько улучшена с V5.1!
Давайте взглянем на следующие 2 примера сравнения V5 и V5.1 на нежелательные границы/текстовые артефакты.
Пример 1 — Используемая подсказка:
Go where you’re treated best (Иди туда, где к тебе относятся лучше всего)
V5:
V5.1:
Пример 2 — Используемая подсказка:
Deja Vu (Дежавю)
V5:
V5.1:
5. Улучшенная резкость
«Резкость» в изображениях относится к тому, насколько четко отображаются детали на изображении. Отсутствие резкости означает, что изображения выглядят «мягкими» или «размытыми» с отсутствием мелких деталей.
Несмотря на то, что изображения V5 уже довольно хороши по резкости, V5.1 находится на другом уровне выше.
Давайте взглянем на следующие два примера, сравнивая V5 и V5.1 на уровне резкости.
Пример 1 — Используемая подсказка:
A group of three emojis talking to each other (Группа из трех смайликов разговаривает друг с другом)
V5:
V5.1:
Пример 2 — Используемая подсказка:
A robot tiger (Робот-тигр)
V5:
V5.1:
Демонстрация некоторых действительно крутых изображений MidJourney V5.1
Готовясь к этой статье, я создал множество действительно потрясающих изображений с помощью MidJourney V5.1. Вместо того, чтобы держать их все при себе, я хотел бы поделиться со всеми вами:
Используемая подсказка:
When AI takes over the world (Когда ИИ захватит мир)
Используемая подсказка:
A charming wooden house in between Switzerland mountains, sunset lighting, in Lego (Очаровательный деревянный дом между горами Швейцарии, освещение заката, в Lego)
Используемая подсказка:
How the world looks like in 100 years (Как будет выглядеть мир через 100 лет)
Используемая подсказка:
Giant airplane looking like a double deck bus in Kowloon City in Hong Kong, art by Otomo Katsuhiro crossover Yayoi Kusama and Hayao Miyazaki --ar 4:5 --s 750 (Гигантский самолет, похожий на двухэтажный автобус в Коулун-Сити в Гонконге, искусство Отомо Кацухиро, кроссовер Яёи Кусамы и Хаяо Миядзаки)
Используемая подсказка:
Bedroom melting into the ocean (Спальня сливается с океаном)
Используемая подсказка:
A fantasy train station in 2080 (Фантастический вокзал в 2080 году)
Используемая подсказка:
When AI goes back to 1970s (Когда ИИ вернется в 1970-е)
Ближайшие планы MidJourney
Во время одних из недавних «рабочих часов» в MidJourney Discord (общий звонок с командой) они раскрыли несколько интересных планов на будущее:
- Команда все еще усердно работает над выпуском V6 , который они надеются запустить через несколько месяцев.
- С V6 мы увидим новый уровень реализма и качества , которого раньше не видели.
- Будут и более продвинутые опции, такие как возможность рисовать вещи и получать изображения, созданные MidJourney из ваших рисунков .
- Команда работает над одной из самых востребованных функций: возможностью получить последовательных персонажей из MidJourney.
- Будет расширенный пользовательский интерфейс за пределами Discord.
- Они готовы выпустить API для MidJourney.
Последние мысли
Можете ли вы представить, как MidJourney будет развиваться через год?
Думаю, даже команда MidJourney не может предсказать! В чем я уверен, так это в том, что в этом безумно быстром мире ИИ, как только вы перестанете учиться и обращать внимание, вы отстанете.
Давайте отправимся в это сумасшедшее путешествие вместе, продолжайте учиться и получать удовольствие!
Я рад, что я правильно понял работу и недостатки этого ИИ по его бесплатной версии. Как по мне, то ИИ генерирует зрительный мусор фотографического качества. Конечно достижение очень-очень большое, но мусор - это все же мусор. И пока ни о какой замене художников речи быть не может.
Не думаю, что в ближайшем будущем произойдет замена каких то профессий включая художников, но симбиоз Человек + Нейросеть явно превосходит Сапиенсов, которые сопротивляются эволюции.
Надо ещё учесть, что буквально пол года назад не существовало ChatGPT и Midjourney v5, а теперь представь, что будет через пару лет)) интересно или страшно? 😏
Благодарю за комент 😉 новая статья уже в профиле)
Кто знает как можно подсказать MJ, что мне важно 5 пальцев у человека?😁
Так 5-я версия давно это знает. Очень редко выдаёт убогие варианты.
Благодарю тебя за комент 😉 новая статья уже в профиле)
Wow! Вот это я понимаю ИИ.