Версии или модели Midjourney
Почему «модель», а не версия?
Версия программы — это эволюция её кода. Разработчики улучшают работу, добавляют функции или обновляют дизайн. Иногда полностью переписывают код. Если говорить об искусственном интеллекте, то «модель» — это эволюция не столько кода, сколько подхода к обучению. Это приводит к появлению новой модели поведения ИИ.
Разница между третьей и четвёртой версией Midjourney настолько велика, что это уже сложно назвать эволюцией кода. Я бы сказал, что v4 — это новый разум. Он обучался с помощью других методов и обладает другими навыками. И хотя он выполняет те же самые задачи, выполняет он их по-другому.
Как выбрать модель Midjourney
Можно выбрать нужную модель через настройки или указав в конце запроса параметр, например, --niji или --v 1.
Сравниваем модели
Я коротко опишу каждую модель, но чтобы наглядно показать разницу между ними, возьму три запроса — материальный, абстрактный и фантастический — и попрошу каждую из моделей нарисовать эти сюжеты.
- Материальный: рыжий кот преследует мышь
- Абстрактный: искусственный интеллект обдумывает миллионы идей
- Фантастический: космический корабль будущего на орбите Юпитера
В запросах не будет фрагментов и параметров, поскольку многие из них поддерживаются исключительно в четвёртой версии и в Niji. Все семь версий поддерживают соотношение сторон 2:3, поэтому я буду использовать его.
Midjourney v1
Эта модель была основной в течение двух месяцев с февраля по апрель 2022 года. Создаёт очень абстрактную и не слишком внятную картинку.
Midjourney v2
Эта модель была основной почти четыре месяца — с апреля по июль 2022 года. Разработчики описали её тремя словами: креативная, цветастая, живописная. Изображения этой модели лучше соответствуют текстовому запросу, чем у v1.
Midjourney v3
Была основной моделью с июля по ноябрь 2022 года. Именно эта модель вышла в первое публичное тестирование, получила первых платных подписчиков и сделала команду Midjourney известной всему миру.
Модель создаёт необычные композиции и неплохо соответствует текстовому запросу. В этой версии появилась возможность сохранять процесс генерации в видео.
Midjourney v4
Текущая версия Midjourney выпущена в ноябре 2022 года.
У этой модели полностью изменилась архитектура и расширилась база для обучения. В отличие от предыдущих версий, v4 обладает представлением о том, как выглядят самые разные существа и локации, умеет создавать очень подробные изображения и показывать взаимодействие между разными объектами в кадре. Умеет точно соответствовать текстовым описаниям. В этой версии впервые появилась возможность генерировать результаты на основе других изображений.
Niji
Niji — это коллаборация между командами Midjourney и Spellbrush, модель, которая сфокусирована на изображениях в стиле манги и аниме. Обученная на японской иллюстрации, эта версия «понимает» эстетику аниме и создаёт динамичные композиции, где в центре внимания находится персонаж.
Как одна из «веток» v4, Niji умеет работать с фрагментами и изображениями в запросах.
Test и Test Photorealistic
Кроме стабильных моделей, разработчики выпускают «временные» версии, предназначенные для тестирования сообществом. Текущие тестовые модели называются Test и Test Photorealistic. Команда Midjourney не описывает их в подробностях: модели постоянно дорабатываются. Это не делает их менее интересными, по крайней мере, для тех, кто любит эксперименты.
Модель Test — более «художественная» с высоким соответствием текстовому запросу. Модель Test Photorealistic генерирует фотографичные результаты. У обеих есть параметр --creative, который делает изображения в сетке более разнообразными.
Возможности тестовых моделей «урезаны»: они не умеют использовать картинки в качестве эталона, не умеют делить запрос на фрагменты и генерируют только два изображения в сетке (или одно, если соотношение сторон отличается от квадрата).
Midjourney v5
Если очень грубо посмотреть на продолжительность жизни предыдущих моделей, то казалось, что Midjourney v4 просуществует около 200-210 дней. Но разработчики планируют выпустить v5 уже на этой неделе!
Уже сейчас для всех платных подписок доступны несколько тестирований, например, https://www.midjourney.com/rate/pairs/v5-two-similar/, где вам нужно выбрать то изображение, которое вам больше нравится: оба изображения созданы пятой моделью.
Платные подписчики могут воспользоваться пятой моделью, для этого её нужно выбрать в настройках, либо добавить к запросу параметр "--v 5".
Обратите внимание, что пятая модель находится в работе и ещё будет меняться.
А лучшее обучение — это практика, поэтому каждый день мы тренируемся на котиках. Смотреть на это можно в нашем кошачьем канале. Всем добра и валерьяны за наш счёт!