Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney
Для создания хороших образов с помощью DALL-E 3 не нужно быть экспертом в области создания промтов.
Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.
В начале октября Dall-E 3, модель преобразования текста в изображение, разработанная компанией OpenAI, стала доступна пользователям ChatGPT Plus. Это означает, что вам не нужно оплачивать дополнительные подписки, такие как Midjourney или LeonardoAI, чтобы генерировать изображения, а можно делать это внутри ChatGPT!
Генерация изображений с помощью Dall-E 3 несколько отличается от других инструментов искусственного интеллекта. Такие инструменты, как Midjourney, заставляют нас учиться промтам для получения хороших изображений, но с Dall-E 3 нам не нужно так много промтов для получения хороших изображений. Фактически, нам нужно только быстро описать, что мы хотим, и Dall-E 3 создаст для вас промт.
Давайте посмотрим, чем Dall-E 3 отличается от других инструментов и не пора ли отказаться от подписки на Midjourney.
Как использовать DALL-E 3 в ChatGPT
Получить доступ к Dall-E 3 можно разными способами, но единственный способ получить Dall-E 3 в ChatGPT - это подписка ChatGPT Plus. Если вы являетесь подписчиком ChatGPT Plus, то увидите Dall-E 3 в GPT-4.
Включите Dall-E 3, чтобы начать создавать изображения с помощью ChatGPT.
Сначала я попрошу ChatGPT создать образ собаки-супергероя. Промт будет довольно простым.
a dog that is a superhero
После нажатия клавиши Enter будут сгенерированы 4 промта и изображения.
Итак, Dall-E 3 делает промт за нас. Круто, не правда ли?
Вот 4 изображения, которые я получил.
Мне нравится первый вариант. Если щелкнуть на нем, то изображение станет более подробным, а справа появится промт, созданный для этого изображения.
Самое замечательное в ChatGPT с Dall-E 3 то, что создать новое изображение (или изменить существующее) так же просто, как и продолжить общение с ChatGPT. В отличие от других инструментов, вам не нужно копировать/вставлять исходный промт и редактировать его, чтобы получить новое изображение или добавить объекты.
Допустим, я хочу получить изображение, на котором моя собака-супергерой летит. Вот промт, который я использовал.
make dog #1 flying like a superhero
Я ожидал получить ту же собаку, что и на предыдущем изображении, но получил летающую собаку в красном плаще.
Чтобы продемонстрировать возможности Dall-E 3 и ChatGPT, я назову эту собаку Максом и попрошу ChatGPT сгенерировать дом Макса.
Let’s say this dog’s name is Max. Generate an image of Max’s house
Этот промт выдал большие дома и крошечный домик для собаки, поэтому пришлось использовать второй промт, чтобы получить результаты, приведенные ниже.
generate only the dog’s house
Несмотря на то, что первый промт работал плохо, для его исправления нам не пришлось создавать промт с нуля, а лишь указать ChatGPT, что именно мы хотим изменить.
Вот еще один пример. Допустим, мне нравится дом № 1, и я хочу, чтобы на этом изображении была моя собака-супергерой.
can you put Max the superhero dog in picture #1?
ChatGPT и Dall-E 3 понимают меня так, как не понимает ни один другой инструмент искусственного интеллекта.
Единственная проблема заключается в том, что нет единообразия персонажей в изображениях, но когда-нибудь это можно будет исправить. Кроме того, я обнаружил еще одну проблему: Dall-E 3 отказывается генерировать изображения из-за авторских прав. Например, он отказался генерировать изображение Золушки, поэтому для обложки этой статьи мне пришлось довольствоваться "сказочной принцессой".
Что мне больше всего нравится в Dall-E 3, так это то, что можно генерировать изображения и изменять их, используя простой английский язык. Dall-E 3 кажется очень хорошим инструментом для тех, кто хочет генерировать AI-изображения без необходимости изучать написание промтов.
Но лучше ли он, чем Midjourney?
DALL-E 3 против Midjourney
Давайте сравним эти инструменты искусственного интеллекта, используя одни и те же промты. Я выскажу свое мнение о результатах, полученных с помощью обоих инструментов, а вы сможете оценить изображения самостоятельно.
DALL-E 3 против Midjourney: Понимание промтов
Dalle 3 известен своей способностью понимать промты, даже с минимальным количеством текста, по сравнению с Midjourney. Я решил проверить это, предоставив один и тот же промт этим двум инструментам ИИ (спойлер: разница существенна).
Промт: “An elegant woman in a white dress with red embroidery and heels, with a husky on a leash walking in the central park of Manhattan”
Вот что я получил с помощью Dall-E 3.
Вот что у меня получилось в Midjourney.
Как видите, Dall-E 3 гораздо лучше понял мой промт и выдал более соответствующие ему изображения. Даже после третьей попытки с Midjourney мне не удалось получить красную вышивку, более того, я получил несколько неточных рисунков, как показано на третьем изображении, где хаски оказался отдельно от своего поводка.
DALL-E 3 против Midjourney: Качество и реалистичность изображений
Это, пожалуй, следующий, но не менее важный фактор, который необходимо учитывать при выборе AI-инструмента. Как я уже упоминал в одной из своих предыдущих статей, в последнем обновлении v5.2 компания Midjourney значительно улучшила качество своих изображений. Теперь изображения выглядят невероятно реалистично, и их трудно отличить от реальных фотографий.
Теперь давайте посмотрим, какого качества изображения можно добиться с помощью Dall-E 3.
Промт: “Portrait of a girl and a bearded man on Miami Beach at sunset”
Мне очень нравятся эти снимки. Dalle 3 четко передал суть фотографии с океаном, зданиями Майми, пальмами и даже людьми. Но если говорить о качестве и реалистичности, то я считаю Midjourney победителем.
Допустим, нам нужно сделать коммерческое изображение.
Промт: “Raspberry pancake”
И вот что у меня получилось в Midjourney.
Оба инструмента генерируют хорошие изображения, но при ближайшем рассмотрении видно, что изображения Midjourney имеют более высокое качество и более реалистичны.
DALL-E против Midjourney: Насыщенность цвета
Думаю, вы заметили на предыдущих изображениях, что Dall-E 3 имеет различия в насыщенности цветов и контрастности по сравнению с Midjourney, причем последняя имеет преимущество.
Промт: “Cat in an astronaut costume in space with flowers”
Вот что я получил с помощью Dall-E 3.
А теперь изображения Midjourney.
В данном случае Midjourney создал очень реалистичные изображения, в то время как Dall-E 3 - карикатурные.
DALL-E 3 против Midjourney: Стили
Это очень важный аспект изображения. Давайте посмотрим, какие изображения получаются при использовании обоих инструментов с точки зрения стиля.
Промт: “Oil painting of a small house in the Alpine mountains”
Вот что я получил с помощью Dall-E 3.
Я получил только 2 изображения, и они скорее мультяшные, чем нарисованные маслом.
Вот что я получил с Midjourney.
Midjourney (в очередной раз) позволил получить более качественные изображения, и я искренне рад полученным результатам.
DALL-E 3 против Midjourney: Рисование знаменитостей
Наконец, я хочу посмотреть, насколько далеко заходит политика авторского права в Dall-E 3, попросив его сгенерировать изображения с некоторыми знаменитостями.
Промт: “Angelina Jolie cuts down trees, photo from the 80s”
Dall-E 3 прекрасно понял промт, но нарисовал... не Анджелину Джоли.
Midjourney имеет базовое представление о том, кто такая Анджелина Джоли, но не совсем понимает концепцию моего промта.
В целом Dall-E 3 очень отзывчив на промты и достаточно удобен в использовании. Однако если мы обратим внимание на реалистичность, насыщенность цветов, качество и прорисовку людей, животных и еды, то Midjourney будет явным победителем.
Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.
Оригинал на английском - здесь.
Действительно, результаты удивляют, в хорошем смысле)
Но все равно до МЖ пока не дотягивают.
Комментарий удалён автором поста
Ничего крутого не увидел. Как это через скайп? Может, с ботом в телеграме перепутали?
Изображение очень впечатляют, это реально то что я искала. Спасибо вам, что вы даёте нам эту информацию, буду пользоваться, спасибо.
Как по мне, так и миджорни рисует еще так себе, а про dalle я вообще молчу. Карикатуры, да и только. Разве что бесплатно. Кто им пользуется, интересно?
Результат просто потрясающий! Я давно искала что-то подобное! Спасибо большое!