Нейросеть дня «DALL-E 3»: генерируйте изображения вместе с текстами прямо из ChatGPT
Нейросетями для генерации изображений уже никого не удивишь. На этом рынке царят Midjourney и Stable Diffusion, которые умеют почти всё, почти. Но есть одно слабое место, которое пока никто не победил, — тексты. Даже очень простые слова на изображениях даются с трудом, а со шрифтами вообще мрак. И тут на сцену выходит обновлённая DALL-E.
DALL-E 3 — это новая версия генеративной нейросети от OpenAI. Позволяет создавать любые изображения по текстовому описанию, и в отличие от конкурентов, неплохо справляется с текстами на изображениях. Старики помнят, что именно с DALL-E когда-то началась вся эта это нейролихорадка. Но потом ребята из OpenAI сфокусировались на ChatGPT и упустили рынок изображений.
Что умеет DALL-E 3:
- Генерирует изображения высокого качества и реалистичности, держит пропорции и симметрию, даже знает сколько пальцев на руке
- Намного лучше конкурентов справляется с текстами. До совершенства пока далеко, но на английском можно добиться приемлемого качества
- Более точно следует промпту, меньше выдумывает
- Хорошо справляется со сложными запросами на русском языке
- Доступен прямо из интерфейса ChatGPT (только в платной версии)
Из минусов:
- Отказывается генерить известных людей (оставим Папу Римского в покое)
- Не хочет копировать стили ныне живущих художников
- Больше заточена под анимацию, с фотореализмом чуть хуже
- Нет инструментария редактирования и доработки сгенерированных изображений
Beta-версия DALL-E 3 доступна только в платной версии ChatGPT, но Microsoft любезно предложил поиграться с ней беслплатно на базе Bing. При регистрации даётся 25 ускоренных генераций (100 изображений), про деньги пока не говорят. В любом случае для использования из России потребуется VPN.
P.S. Размышления о будущем:
Не надо быть гением, чтобы догадаться, что DALL-E 3 создаётся для работы в связке с ChatGPT. Упор на тексты и жесткое соответствие промпту там не просто так. OpenAI делают универсальную нейросеть для простых людей, а не для дизайнеров и художников. Будущее, в котором ChatGPT не просто пишет текст, но и создаёт к нему изображения, совсем близко
-----
Авторские обзоры ИИ-инструментов несколько раз в неделю. Удобнее читать в Telegram — https://t.me/universe_ai