Протестил новую модель для генерации картинок 4o. Дизайнеры больше не нужны?

Уже неделю, как всем пользователям ChatGPT доступна новая модель для генерации картинок Introducing 4o Image Generation (официальный blog-post читайте здесь)

Когда я посмотрел картинки из блог поста первая мысль была такой: "нууу, как обычно, супер красивые изображения в пресс релизе, над которыми работала целая команда неделями". Но все таки решил попробовать и с разу же офигел.

Для теста решил сразу же начать со сложной задачи: инфографика. Почему задача сложная?

В качество промта скинул пост про OCR со своего тг-канала и попросил сделать инфографику и тут случилась магия:

Скептики: говно а не дизайн, - Ок, но даже на этот говно-дизайн пришлось бы потратить n-ное количество времеи в Figma, а если опыта нет,то просто поднять лапки и забить

У меня сформировалось такое мнение по поводу всех продуктов:

DALL-E было болью и чем-то безнадежным
midjourney - это нужно написать промт высотой в пятиэтажку с указанием камеры, разрешений, ракусров, композиций, а я то всего лишь хочу, чтобы нейронка меня поняла

Протестил новую модель для генерации картинок 4o. Дизайнеры больше не нужны?

Recraft - свет в оконце. Красивые пресеты, визуал, как доска в Figma, ну мёд. Но с какими-то задачами на справлялсь:

Задача: по фотке сделать постер в стиле комикса. Recraft не справился

Час ушел на поиск лучшего пресета, ничего не нашел, еще минут 30 на поиск сервиса с триальным периодом, который делает фотки в стиле комиксов. Благо, он справился с задачей.

И последний момент - нейронки вообще не могли работать с текстом. Когда я был в Нейроцехе, то было много людей, которые приходили в чат с запросом:

- А можно сделать баннер, где будет объект + текст?

- я думал, ну ты сказочник, конечно, нет.

А сейчас ответ, конечно, да и это супер просто!

Отдельный момент, это UI процесса. Изображение постепенно появляется из блюра. GPT не оставляет тебя без контекста и это не скучный прелоадер, ты как будто понимаешь, ок еще немного ждать и все будет готово - это здорово!

В среднем картинка генерится 1-2 минуты

Да, прозвучит грубовато: «Дизайнер не нужен — два промта, и всё готово!». На самом деле, если вы SMM или небольшой штат + ограниченный бюджет, но нужно пилить контент - это будет прорыв для вас. Если вы занимаетесь товарным бизнесом и нужно постоянно показываь товар, а предметная фотосессия одна, то это ваше ограничение. GPT его снимает, а главное снимает за 2 минуты!

Месяц назад искали оптимальную обложку для товара с высоким CTR. Этот процесс выглядел так:

Поставили задачу - сделать 4 обложки для поиска лучшей (лучшая - самый высокий CTR)
Из-за текущий нагрузки, я только через 4 дня сел, чтобы собрать референсы и составить УТП
Дизайнер делает макеты 5-6 рабочих дней, так же из-за нагрузки
Потом, конечно же, ПРАВКИ, ПРАВКИ, ПРАВКИ - а это коммуникация: все передать, не забыть, все учесть, а главное понять
И 2 недели на тест

Итог: только через месяц можно сделать выводы

Сейчас этот процесс займет 2 часа.

Примеры в карусели, какие обложки у меня получились. При этом в эти 2 часа вошли поиск референсов и подбор УТП.

Мне всегда казалось, что Bork тратит сотни тысяч рублей на каждую свою фотосессию, плюс сутки работы съёмочной команды, сотни часов на рендеринг фоток.

Раньше казалось, что это невозможно за дешево повтороить, а все вокруг только подверждали это:

Я подходил к дизайнерам: Сделайте мне точно также — блин, ну тут тени, это мне нужно больше времени, чтобы фотошопить, сделать тени, покрасить, тут цвет по другому ложиться
Подходил к фотографу: Сделайте мне точно также — блин, загруз, да мы с нашим цветом так сделать не можем, нужно будет свет арендовывать, нужно будет делать декорации, кстати, мы тут думали купить новые фоны, че может как раз купим?

А тут я буквально за $200 и 30 минут получил 3 уникальные сцены в стиле Bork.

Специально обрезал картинки на втором шаге, чтобы он генерил нужного размера

Хочешь взять лендинг конкурента и быстро перебить все визуалы под свой бренд? Два промта — и у тебя уже есть набор уникальных картинок под нужный размер. Это сокращает время разработки с двух недель до одного дня.

Еще один гемор - это когда в команде нет 3D дизайнера, который может сделать модельку, которую можно вставлять в нарисованные эстетичные сцены. Раньше на то, чтобы вставить чашку в кофемашину уходило несколько часов и все равно было видно, что чашка вставлена, сейчас это круто решается. При чем у тебя может не быть точного ракурса товара. Но тени, композиция, размеры - все будет идеально

До этого дня, я бы не смог получить картинку справа, либо это выглядело сомнительно и заняло пол дня дизайнера в фотошопе

Обычно генеальные идеи приходят за час до дедлайна и раньше все это упиралось в такой диалог:

Какая парадигма: в сжатые сроки нужно выбирать хорошее, а не идельное, тем более, когда идеальное в голове, будет так себе в макете

Но сейчас этот диалог бы перешел в чатГПТ: «Да без проблем! Дай мне промт со ссылкой на референс — я сделаю так, что цветы и бабочки будут плавно переходить на фон, как будто узор растворяется в пространстве».

Классный результат за 30-40 минут. Если вам он не нравится. Воспринимайте это как супер референс. Вы можете час описывать задачу или потратить час на то, чтобы сделать то, что вы хотите видеть от дизайнера

Каждый же мечтал нарисовать какой то скетч и чтобы дизайнер точно его повторил, так как ты хочешь - теперь это возможно!

Такой промт: Сделай, пожалуйста, инфографику для маркетплейса для вертикального пылесоса. фотография турбощетки на советском ковре, который засасывает предметы с ковра: носки, игруки, консруктор, шерсть домашних животных. Максимльно реалистичное фото. визуализируй мощность всасынвия. Турбощетку я прикрепил, используй мое изображения как в качестве концепции, можешь не придерживаться его
максимально простой язык, без запар с тонкими настройками

Как включить новую модель для генерации изображений?

Заходим https://chatgpt.com/ . Выбираем GPT-4o и "Создать изображение"

У пользователей, с какой подпиской есть доступ?

GPT-4o для генерации изображений начинает распространяться с сегодняшнего дня для пользователей с тарифами Plus, Pro, Team и Free — по умолчанию как основной генератор изображений в ChatGPT. В ближайшее время доступ также получат пользователи тарифов Enterprise и Edu.
Из официального релиза от 25 марта

Что хотел до вас донести:

1. Теперь у каждого есть инструмент по созданию всех смелых идей, если мы говорим про картинки

2. В ближайшем будущем останутся только супер-таланты, потому что если ты делаешь дольше ИИ (а это все) и со средним качеством (сопоставимым с GPT), то перспективы туманны

3. Активировать вас поробовать новую модель. Я показывал изображения, которые понравились не только мне, но и моим коллегам. Это ценно, так как это не просто примеры из вакуума, а тест модели на рабочих задачах

4. Обычно все говорят, что круто быть у истоков, что уже поздно запрыгивать в поезд. А мне кажется, чем позже тем круче - у тебя нет блоков, что ИИ что-то не может. У меня были предубеждения, что ИИ не справится с текстом, что она не сможет повторить предмет без своих выдумок, но он смог. Поэтому если у вас был не удачный опыт с LLM-моделями, попробуйте снова! Каждый месяц мир меняется

Это мой первый пост, спасибо, что доскролили до сюда! Подписывайтесь на мой ТГ-канал!

t.me

Данила Прыгов

Протестил новую модель для генерации картинок 4o. Дизайнеры больше не нужны?

Что меня так поразило-то?

«Дизайнеры не нужны»? Ну, не совсем

Быстрый тест гипотез: как сократить время на поиск лучшей обложки на МП с 2х недель до 2х часов

Пример с Bork: тысячи рублей vs. 30 минут

Чашка, тени и сложные ракурсы

Больше нельзя сказать: Это невозможно сделать

И самый ТОП

Как попробовать? Где взять доступы?

Конец