GPT-4o рисует лучше: в ChatGPT обновили генератор изображений
OpenAI интегрировала новую модель GPT-4o прямо в интерфейс ChatGPT, заменив предыдущую систему на базе DALL·E 3. Это обновление выводит визуальные возможности ИИ на новый уровень: теперь ChatGPT может создавать более сложные, детализированные и логически выстроенные изображения — и делать это в ответ на обычные текстовые запросы.
Что нового умеет GPT-4o?
GPT-4o — это не просто улучшенный генератор, а мультимодальная модель, способная «понимать» как текст, так и изображения. Вот ключевые улучшения:
- До 20 объектов в сцене: модель сохраняет правильные отношения между объектами, их пропорции и расположение
- Контекстная последовательность: ИИ учитывает историю чата и предыдущие изображения, сохраняя стиль, сюжет и ключевые детали
- Анализ изображений от пользователя: можно загрузить фото, и ИИ использует его как контекст — добавит элементы из него в новую картинку, продолжит стиль или отразит сюжетные детали.
- Улучшенный текст на изображениях: подписи и надписи стали более точными, понятными и визуально чистыми
Рендеринг может занимать до минуты — из-за сложности и уровня детализации, но результат выглядит заметно лучше по сравнению с DALL·E 3.
С 25 марта 2025 года новая функция начала поэтапно появляться в ChatGPT у пользователей следующих тарифов:
- Free — до 3 изображений в день
- Plus, Pro, Team — без ограничений
- Enterprise и Education — доступ появится в ближайшее время
Также в ближайшие недели ожидается доступ к API, что откроет возможности интеграции GPT-4o Image в сторонние продукты и креативные платформы.
В отличие от DALL·E 3, новая модель лучше справляется с визуальной логикой, креативными задачами и персонализацией. Она может быть особенно полезна в дизайне, презентациях, сторителлинге, образовательных проектах и даже генерации комиксов или раскадровок.
GPT-4o превращает ChatGPT в полноценного визуального ассистента, способного понимать контекст, реагировать на визуальные примеры и адаптировать стиль под запрос.