Нейросеть дня «DALL-E 3»: генерируйте изображения вместе с текстами прямо из ChatGPT

Нейросетями для генерации изображений уже никого не удивишь. На этом рынке царят Midjourney и Stable Diffusion, которые умеют почти всё, почти. Но есть одно слабое место, которое пока никто не победил, — тексты. Даже очень простые слова на изображениях даются с трудом, а со шрифтами вообще мрак. И тут на сцену выходит обновлённая DALL-E.

DALL-E 3 — это новая версия генеративной нейросети от OpenAI. Позволяет создавать любые изображения по текстовому описанию, и в отличие от конкурентов, неплохо справляется с текстами на изображениях. Старики помнят, что именно с DALL-E когда-то началась вся эта это нейролихорадка. Но потом ребята из OpenAI сфокусировались на ChatGPT и упустили рынок изображений.

Что умеет DALL-E 3:

  1. Генерирует изображения высокого качества и реалистичности, держит пропорции и симметрию, даже знает сколько пальцев на руке
  2. Намного лучше конкурентов справляется с текстами. До совершенства пока далеко, но на английском можно добиться приемлемого качества
  3. Более точно следует промпту, меньше выдумывает
  4. Хорошо справляется со сложными запросами на русском языке
  5. Доступен прямо из интерфейса ChatGPT (только в платной версии)

Из минусов:

  1. Отказывается генерить известных людей (оставим Папу Римского в покое)
  2. Не хочет копировать стили ныне живущих художников
  3. Больше заточена под анимацию, с фотореализмом чуть хуже
  4. Нет инструментария редактирования и доработки сгенерированных изображений

Beta-версия DALL-E 3 доступна только в платной версии ChatGPT, но Microsoft любезно предложил поиграться с ней беслплатно на базе Bing. При регистрации даётся 25 ускоренных генераций (100 изображений), про деньги пока не говорят. В любом случае для использования из России потребуется VPN.

P.S. Размышления о будущем:
Не надо быть гением, чтобы догадаться, что DALL-E 3 создаётся для работы в связке с ChatGPT. Упор на тексты и жесткое соответствие промпту там не просто так. OpenAI делают универсальную нейросеть для простых людей, а не для дизайнеров и художников. Будущее, в котором ChatGPT не просто пишет текст, но и создаёт к нему изображения, совсем близко

-----

Авторские обзоры ИИ-инструментов несколько раз в неделю. Удобнее читать в Telegram — https://t.me/universe_ai

66
3 комментария

Классно, попробовал третью версию, но не совсем понял как делать именно не анимацию, а как будто настоящую картинку, может кто то знает?

Ответить

и нигде не пишут, работы в DALL-E 3 приватные или нет =( вижу свои генерации только я, или они попадают куда-то в общий доступ =(

Ответить

У меня есть подозрение, что изображения не генерятся, а ищутся готовые в какой-то большой базе по ключевым словам...

Ответить