Что умеет генератор изображений Midjourney и как он работает. Как пользоваться в России
Насмотрелись мы уже этих подборок изображений. А теперь разберемся, что он умеет по-делу, как работает и как им пользоваться в России.
Как работает Midjourney?
В случае большинства генераторов изображений создатели написали массу информации о том, как они работают, а также опубликовали их исходный код — но это не относится к Midjourney. Команда, стоящая за ним, раньше вообще молчала о его предыстории и обучении. Я нашел интервью с основателем, так то некоторая информация все же есть.
Но сразу ясно, что наиболее вероятно, что Midjourney использует систему, аналогичную Dall-E и Stable Diffusion, а эти обе компании подробно объяснили свои методы обучения.
Их модели были обучены на сопоставлении изображений и текста, который используется для их описания. Так же в некоторых старых материалах Midjourney пишет, что, как и ее конкуренты, она ищет в интернете изображения и текст для их описания, используя миллионы опубликованных изображений для обучения.
Это просто компиляция данных из интернета. Мы используем открытые наборы данных, которые публикуются, и тренируемся на них, пишут в MJ.
Более подробно про принцип генератора изображений, на примере Dall-E, я написал тут
Процесс генерации изображения с помощью Midjorney:
А вот фрагмент из самого нового интервью с генеральным директором Midjorney, где он наконец поясняет, как работает mj. Ну в итоге все так, как мы предполагали:
Это просто большой фрагмент данных из интернета. Мы используем открытые наборы данных, которые публикуются, и тренируемся на них. И я бы сказал, что это то, что делают 100% людей. Мы не были привередливы при выборе стратегии обучения сети. Наука быстро развивается с точки зрения того, сколько данных вам действительно нужно для обучения модели. Потребуется несколько лет, чтобы во всем разобраться, и к тому времени могут появиться модели, которые можно будет тренировать практически без внешних данных. На самом деле никто не знает, что они могут сделать и как будут развиватся.
Как пользоваться Midjorney?
Глюки
Что-то может пойти не так с изображением, ведь модель не идеальна. Например, могут возникнуть проблемы с созданием рук (особенно пальцев) или других сложных объектов, а фоны часто могут быть размытыми или спутанными, но это проблемы, которые вы найдете сейчас в любой из подобных моделей.
Сгенерировали, вроде хорошие картинки:
Но если увеличить и посмотреть на пальцы…
К счастью, такое сейчас существенно реже встречается. И вообще mj априори выводит часто крупные планы лиц, где не видно рук. Может потому, что сами понимают, что с пальцами еще не решили вопрос?
Еще вариант изменения при увеличении. Дарт Вейдер в Макдоналдс.
Увеличили вторую картинку:
Вроде все ок, но обратите на задний план…
Пример генерации в Midjorney
Делаем иллюстрации для статьи в Midjorney
Потестируем на Владимире Ленине. Не знаю почему. Видимо, потому-что он круто получился (на главном фото статьи).
Нам нужно написать статью о Ленине и оформить ее качественными иллюстрациями, да еще и уникальными, чтобы лучше индексироваться поисковиками.
Вводим простой запрос: Ленин ребенок (нужно вводить на английском!)
Сразу получаем хорошие варианты, а если не понравилось, можно добавить ключевых слов и более детально прописать задание к нейросети.
Очень удобно, что при генерации выводится сразу 4 варианта, в отличии от Dall-e и Stable Diffusion. При использовании платной версии это почти в 4 раза экономит наши деньги.
Дальше: Юный Ленин
События разгораются и Ленин уже во время революции 1917 года:
Довольно концептуальные варианты получились, мне больше всего понравился 4 вариант. Но все же он выглядит, будто Ленин смотрит на неестественно огромную стаю черных ворон, подлетающую к толпе людей вокруг него.
Не буду мучать вас всей историей жизни его: старый Ленин.
Мне кажется, получился недостаточно старым. Иногда при генерации картинок в какой-то их части может быть подобие кривого текста. Это как-раз потому, что генерация идет с помощью диффузии кучи фоток и нейросеть решает, что брать от какой фотки. Тут она решила оставить текст, хоть и исказив его — это все же недоработка нейросети.
И вообще — с текстами сеть не работает нормально, имеется ввиду, что не создает картинки с нормальным текстом. Для Midjorney текст — это тоже изображение и в нем нет логики, как таковой.
Очень старый Ленин:
Ну и по итогу каждой генерации, мы можем выбрать одну, которая нам понравилась.
На примере фоток очень старого Ленина: мне понравилась третья картинка и я жму U3.
Получилась хорошая картинка. Если же приглядеться, вы заметите, что она отличается от первоначальной. Это происходит потому, что нейросеть для увеличения изображения так же применяет диффузию и подбор из кучи картинок.
Параметры в Midjorney
Есть такая штука, как параметры.
mj автоматом выдает квадратные картинки, если вам нужны другие пропорции в конце запроса припишите, к примеру: --ar 4:3
А если делать отметку --version 5, то нейросетью вообще преображается и делает фотографии! А есть фотомодель --testp
Что нельзя в Midjourney?
В нейросети есть запрещенные слова: все что связано с насилием, жаргоном, ущемлением меньшинств. Если писать подобные слова в запросах, MJ блокирует промпт, либо аккаунт на время, либо на всегда.
Как зайти в Midjourney?
Вариант 1
1. Нужно зарегистрироваться в Discord и подключиться через него в MJ
2. После этого мы уже видим свой аккаунт на сайте MJ.
3. С апреля 2023 они, к сожалению, отключили бесплатную версию. Жмем Purchase Plan и выбираем, какой хотим.
4. Российские карты, конечно же не принимаются. Тут уже сами выбирайте методы, как вам оплатить. Гуглите, так как такие вещи в VC нельзя писать=)
Вариант 2
У нас один из проектов: доступ в midjourney через telegram
Иногда ответы не выдает, так как вручную настроена переправка изображений из Discord, но генерирует быстро, 1-3 минуты. Обычно, в подобных проектах ставят slow версию, а это 30-40 минут)))
Если будете пользоваться, обязательно почитайте инструкцию, там все по-делу написано. В ней указаны еще дополнительные параметры для генераций.
Еще подборка картинок из Midjourney
PS. лайк, пожалуйста, он помогает продвижению статьи, а значит дает мотивацию писать дальше
Ну и как положено на VC, канал телеграм))) Канал и чатик
Туда выкладываю статьи VC и то, что нет в VC. Мысли, идеи, опыт.
В закрепленных канале всегда телеграм боты Kolersky для доступа в ChatGPT, GPT-4 без VPN, а так же генераторы изображений Midjourney, Dall-e, Stable Diffusion (проект KolerskyAI).
Midjourney без иностранной карты есть у нас в тг. Так же есть ChatGPT, GPT-4, Dall-e, Stable Diffusion.
В закрепленных в канале:
https://t.me/kolerskych/
Сам бот Midjourney:
http://t.me/Kolersky_Midjorney_Bot
Другие нейросети: https://kolersky.com/kolerskyai
"Midjourney и как он работает"Охуенно понятно стало..
Это как нарисовать сову.
Как работает MidJourney.
1. Берём данные для обучения из открытых источников
2. Рисуем картинку
Автор, ты любитель кликбейтных заголовков?
Как пользоваться в РоссииРоссийские карты, конечно же не принимаются. Тут уже сами выбирайте методы, как вам оплатить. Гуглите=)
спасибо, познавательно
не ну а что вы думали, что вам всё разжуют и в клювик поставят ? Нужно быть более самостоятельными!
- " как пользоваться в России? "
- " никак, уезжайте ! "
Статья пустышка.
Это все просто реклама бота в телеграм, по совершенно завышенной цене, чем у конкурентов. Есть боты, где за 299₽ в месяц либо за1500₽ в год, можно получить доступ сразу и ко всему и к ChatGPT и Midjourney, при чем все работает в одном боте, а не раздельно.
Генерирует очень быстро. Может подписчиков меньше чем у других, но тут шустро генерирует