Нейросеть дня «DALL-E 3»: генерируйте изображения вместе с текстами прямо из ChatGPT

Нейросетями для генерации изображений уже никого не удивишь. На этом рынке царят Midjourney и Stable Diffusion, которые умеют почти всё, почти. Но есть одно слабое место, которое пока никто не победил, — тексты. Даже очень простые слова на изображениях даются с трудом, а со шрифтами вообще мрак. И тут на сцену выходит обновлённая DALL-E.

DALL-E 3 — это новая версия генеративной нейросети от OpenAI. Позволяет создавать любые изображения по текстовому описанию, и в отличие от конкурентов, неплохо справляется с текстами на изображениях. Старики помнят, что именно с DALL-E когда-то началась вся эта это нейролихорадка. Но потом ребята из OpenAI сфокусировались на ChatGPT и упустили рынок изображений.

Что умеет DALL-E 3:

Генерирует изображения высокого качества и реалистичности, держит пропорции и симметрию, даже знает сколько пальцев на руке
Намного лучше конкурентов справляется с текстами. До совершенства пока далеко, но на английском можно добиться приемлемого качества
Более точно следует промпту, меньше выдумывает
Хорошо справляется со сложными запросами на русском языке
Доступен прямо из интерфейса ChatGPT (только в платной версии)

Из минусов:

Отказывается генерить известных людей (оставим Папу Римского в покое)
Не хочет копировать стили ныне живущих художников
Больше заточена под анимацию, с фотореализмом чуть хуже
Нет инструментария редактирования и доработки сгенерированных изображений

Beta-версия DALL-E 3 доступна только в платной версии ChatGPT, но Microsoft любезно предложил поиграться с ней беслплатно на базе Bing. При регистрации даётся 25 ускоренных генераций (100 изображений), про деньги пока не говорят. В любом случае для использования из России потребуется VPN.

P.S. Размышления о будущем:
Не надо быть гением, чтобы догадаться, что DALL-E 3 создаётся для работы в связке с ChatGPT. Упор на тексты и жесткое соответствие промпту там не просто так. OpenAI делают универсальную нейросеть для простых людей, а не для дизайнеров и художников. Будущее, в котором ChatGPT не просто пишет текст, но и создаёт к нему изображения, совсем близко

-----

Авторские обзоры ИИ-инструментов несколько раз в неделю. Удобнее читать в Telegram — https://t.me/universe_ai