Полное сравнение Midjourney v6.1 и v7 (Alpha): что улучшили, что сломали (самый полный анализ релиза + все промты внутри)
Midjourney запустила альфу своей новой версии v7 — с голосовым управлением, Draft Mode и обязательной персонализацией. Звучит как революция?
На деле — не все так однозначно. В этой статье я подробно сравню v6.1 и v7 по ключевым параметрам: качество изображений, скорость генерации, стабильность, точность исполнения промптов и реакции комьюнити. Расскажу, что действительно стало лучше, а что пока вызывает вопросы — честно, по пунктам и с акцентом на реальный пользовательский опыт.
Будут новые обзоры версии v7 (она все еще обновляется), которые я буду публиковать на телеграм-канале "Нейронутые", где я очень подробно и обстоятельно анализирую все ИИ-новости и делаю экспертные обзоры. Подписывайтесь, чтобы не пропустить.
Ключевые особенности V7 (краткое саммари):
1. Персонализация по умолчанию: начать пользоваться моделью можно только, пройдя процесс оценки 200 изображений.
2. Режим "Draft Mode": Позволяет создавать изображения в 10 раз быстрее и за половину стоимости. Этот режим особенно полезен для быстрой итерации идей и поддерживает голосовые команды для более естественного взаимодействия.
3. Поддержка нескольких языков: V7 теперь понимает аудиозапросы на различных языках, включая русский, автоматически переводя их для генерации изображений. Это расширяет доступность платформы для пользователей по всему миру. Однако качество перевода вызывает еще много вопросов.
4. Улучшенное качество изображений: Заметные улучшения в детализации, особенно в отображении лиц и сложных объектов. Тени и освещение стали более естественными, что повышает реалистичность создаваемых изображений. С руками пока беда.
5. Доступность: V7 доступна в режимах Turbo и Relax, предоставляя пользователям выбор между скоростью и стоимостью генерации.
6. И все же...: V7 — это бета продукт, который «выкатили» наспех, после оглушительного успеха Chat GPT 4o и других конкурентов.
А теперь подробно:
📌 Что нового в Midjourney v7 — кратко:
• Голосовое взаимодействие через сайт alpha.midjourney.com
• Draft Mode — генерация за 30 секунд и в 2 раза дешевле
• Персонализация теперь обязательна (200 пар изображений)
• Поддержка разных языков (в т.ч. русского)
• Turbo и Relax режимы остались, стандартный — в разработке
• Upscale и inpainting временно работают на v6
• Планируются частые обновления и система cref/sref 2.0
Что будет добавлено с точки зрения постоянства персонажей: Midjourney активно работает над системой ссылок на персонажей и объекты нового поколения, которая станет частью V7 в ближайших апдейтах. В отличие от старой механики с --cref и --sref, новая система обещает более точную передачу типажа, внешности и даже настроения объектов и персонажей. Это особенно важно для тех, кто создает серии изображений или работает с сюжетными нарративами — от комиксов до сторибордов для видео.
А теперь глубокий анализ: что реально изменилось
🔊 1. Ввод голосом: новшество или фича ради фичи?
Midjourney теперь понимает команды, произнесенные вслух. Это работает только в связке с Draft Mode и требует микрофона. После голосового ввода ИИ сам преобразует речь в текст и генерирует изображения. Сначала вы можете голосом сказать свой промт (на русском, система сама переведет его на англ). А потом давать уточнения к сгенеренным картинкам. Примеры фраз: 👉 “Сделай изображение темнее (светлее) и более детализированным” 👉 “Добавь киберпанковский бэкграунд”. И т.д.
Пояснение: одна из ключевых особенностей V7 — это динамическое редактирование промпта в реальном времени, особенно в голосовом режиме. Это означает, что теперь пользователю не нужно вручную переписывать текст запроса: достаточно сказать, например, «замени кошку на сову» или «сделай вечер», и система сама адаптирует текстовый промпт, запустив новую генерацию. Это приближает опыт работы с ИИ к живому диалогу и значительно сокращает путь от идеи до визуализации.
Новая модель взаимодействия: V7 меняет сам интерфейс взаимодействия с пользователем в зависимости от режима. Когда активен Draft Mode в веб-версии, строка ввода превращается в "conversational prompt bar" — это означает, что система ожидает от пользователя не строгой структуры промпта, а свободных, естественных фраз. Такой подход сближает генеративную ИИ-среду с форматом мессенджера, где можно буквально "разговаривать" с моделью. Это большой шаг к более демократичному, интуитивному UX.
Все это открывает путь к «потоку творчества» (flow state) — больше не нужно формулировать промпты вручную. Но… модель пока ошибается в транскрипции, обрывает фразы и не всегда верно понимает контекст.
🖼 2. Draft Mode — прорыв в скорости, компромисс в качестве
Draft Mode создает картинки в 10 раз быстрее и в 2 раза дешевле, чем v6.1. Они менее детализированы, но быстро "улучшаются" до нужного результата через кнопки Enhance и Vary (при этом все улучшения пока происходят в версии 6.1).
Это идеальное решение для мозгового штурма и создания новых итераций за очень короткий промежуток времени. Но без Enhance — качество ниже, чем у v6.1, особенно в плане рук, фонов и текстов.
🎨 3. Персонализация теперь обязательна
Чтобы начать пользоваться v7, нужно пройти настройку персонализации — выбрать 200 понравившихся изображений. Это позволяет системе подстроиться под стиль пользователя.
Критика: нельзя пока использовать moodboard'ы или старые стили от v6. Новые стили — v7-специфичны, старые мудборды будут работать только в версии v6.
💬 4. Реакция сообщества — не все гладко
В отличие от прежних восторгов, реакция на v7 — неоднозначная. Минусы, которые называют пользователи:
• Качество генерации зачастую ниже при одинаковых промптах с v6
• Руки и текст — по-прежнему слабое место
• cref/sref пока не работают
• Голосовой ввод нестабилен
• С текстами (и уж тем более на русском) — беда.
Мой личный опыт: идентичные промты v6 зачастую пока дают худшие результаты в версии v7. Скорее мы получили версию 6.2, чем полноценную"семерку". Но иногда получается ярче и интереснее. Как в примере с котиком в лодке:
Плюсы версии v7:
• Объективно улучшена детализация лиц
• Свет и тени выглядят правдоподобнее
• Draft Mode дает суперскорость при идеях (мозговой штурм)
• Русский язык теперь работает напрямую
Вывод: стоит ли переходить на v7?
✅ Подходит для:
• Быстрых скетчей и экспериментов (Draft Mode — топ)
• Пользователей, любящих голосовое управление
• Тех, кто хочет персонализированный стиль под себя
• Тех, кто работает с многоязычными промптами
❌ Пока не заменит v6, если вам важно:
• Точное соответствие промту
• Детализированная генерация “с ходу”
• Работа с текстами и анатомией (особенно руки)
• Наличие всех привычных функций v6 (инпейтинг, cref и т.д.)
Сравнение v 6.1 и v 7 Alpha
⚡ Что нужно знать о Midjourney V7 за 60 секунд
Полный редизайн модели
V7 — не просто апдейт, а переписанная с нуля система. Улучшена реалистичность, текстуры, свет, материалы и (немного) анатомия. Руки все еще кривые. Тексты — плохо.
Голосовое управление (новое!)
Теперь можно говорить вместо того, чтобы писать промпты — работает в Draft Mode через браузер.
Draft Mode = скорость + экономия
Создание изображений в 10 раз быстрее и в 2 раза дешевле. Идеально для итераций, не финалов.
Персонализация включена по умолчанию
Выбираешь из 200 пар изображений — и модель подстраивается под твой вкус. Нельзя отключить.
Совместимость с промптами V6.1
--ar, --seed, --style и другие параметры работают. cref/sref пока временно отключены.
Тарифы: Turbo, Relax
Нет стандартного режима. Turbo — быстро, но дороже. Relax — медленно, но выгодно.
Пока нет Upscale, Inpainting и Text-to-Image-фишек
Эти функции временно используют старую модель V6, их портируют позже.
Мнения разделились
Одни восторгаются визуалом, другие говорят: «это просто v6.2». Оценки — от вау до "какашка".
Юридические риски остаются
Как и раньше, модель обучалась на данных из интернета, включая защищённые авторским правом работы.
Финальный вердикт:
Помимо технических улучшений и новых режимов, V7 знаменует собой важный сдвиг в философии Midjourney — от просто генератора изображений к более интерактивной и персонализированной среде творчества. С переходом в веб-интерфейс и появлением Draft Mode с голосовым управлением, пользователи все меньше работают с сухим промптингом и все больше взаимодействуют с ИИ как с полноценным визуальным собеседником. Это делает Midjourney ближе к концепции “со-творчества” между человеком и ИИ, чем к инструменту.
Также важно понимать, что V7 работает на фоне усиливающегося давления со стороны конкурентов, таких как Ideogram, GPT-4o, Reve и т.д. Midjourney по-прежнему держит лидерство в визуальной эстетике, но уже не может позволить себе стагнацию. V7 — это не просто улучшение модели, а стратегическая ставка на скорость, персонализацию и новые форматы ввода, чтобы сохранить внимание креаторов и digital-художников по всему миру.
Наконец, за пределами техники остается важный нерешенный вопрос — юридическая сторона. Midjourney остается в центре споров об авторском праве, и несмотря на свою популярность, компания до сих пор не представила прозрачной документации о том, на каких именно данных обучалась ее модель. Это может стать критическим фактором в будущем, особенно если речь зайдет о коммерческом использовании сгенерированных изображений или интеграции в аппаратные продукты, о которых компания лишь намекнула.
Резюмирую: Midjourney v7 — это не просто новая версия, а попытка переосмыслить взаимодействие с AI в живой диалог. Но путь к идеалу еще не пройден. Пока это больше инструмент для экспериментов, чем для финального продакшна. Главное — потенциал огромен, и развитие обещает быть быстрым.
Что дальше? И когда ждать обновлений.
Midjourney делает ставку на постоянный цикл развития. Команда официально пообещала выпускать новые фичи каждые 1–2 недели в течение ближайших двух месяцев. Это делает V7 не статичной версией, а "живым организмом", постоянно обновляющимся и эволюционирующим. Пользователь фактически становится частью продуктовой команды, влияя на дорожную карту через публичное голосование и обратную связь.
Наконец, важно отметить, что V7 — это экспериментальное пространство, где Midjourney открыто признает возможные слабые стороны. Команда призывает пользователей экспериментировать с разными стилями промптов, потому что старые методы не всегда работают одинаково. Это честный и прозрачный подход, который формирует доверие: V7 — не финальный продукт, а открытая платформа, куда каждый может внести свой вклад и где пока многое определяется не документацией, а реальной практикой.
Есть ли у такого переосмысления будущее? Будем наблюдать.
Подписывайтесь на телеграм-канал "Нейронутые", чтобы не пропустить новые интересные и полезные обзоры нейросетей.
Об авторе: меня зовут Егор Апполонов, создатель телеграм-канала "Нейронутые". Занимаюсь нейросетями уже более трех лет. Специализируюсь на создании AI-видео.
В Midjourney я сгенерил уже 34 536 изображений.