Применимы ли нейросети в автобизнесе? Эксперимент с дизайном изображений
Совсем недавно нейросети были просто забавой, а сегодня их уже считают полноценными и эффективными помощниками человека. Они активно помогают нам не только в механической работе, требующей точности, например, в изучении огромного массива данных, но и в различных креативных задачах – писать стихи, сценарии и рекламные слоганы, создавать мелодии и различную визуализацию. За считанные минуты алгоритмы рисуют качественные (или не очень) изображения по практически любым текстовым запросам. Технический директор Kodix Automotive Андрей Масленников протестировал несколько сервисов и сгенерировал целый альбом картинок с автомобилями. Делимся с вами результатом и своими выводами о том, чем нейросети могут быть полезны автодилерам. Если могут.
Для начала коротко о том, как работает алгоритм. Если говорить простыми словами, нейронная сеть (она же artificial neural network) – разновидность машинного обучения, при котором программа работает по принципу человеческого мозга, состоящего из нейронов, связанных между собой синапсами и передающих электрохимические импульсы. В нейросети роль нейронов выполняют вычислительные элементы, которые имитируют мозг человека. Нейросеть состоит из моделей и данных для обучения, которое может быть как автоматизированным (например, в случае обучения игры в компьютерные игры), так и ручным (например, когда нужно подтвердить, что «вы не робот» и выбрать картинки с автобусами на Google Capcha). Таким образом нейросеть формирует в себе цепочки связей – вот это похоже на автобус, а это на машину.
Ежедневно работая с сайтами автодилеров, мы задумались, а может ли эта технология заменить или упростить жизнь дизайнерам и маркетологам дилерских центров?! Представьте: вы маркетолог в ДЦ, и вам необходимо быстро запустить креативную рекламную кампанию в сети с изображениями Nissan, который дрифтует на закате. Вместо того, чтобы ставить задачу дизайнеру, вы открываете сервис, вбиваете запрос на английском “Nissan doing drifting by the sunset” и через минуту получаете готовые картинки. Это реальность сегодняшнего дня. Но действительно ли нейросети уже можно использовать дилерам для решения маркетинговых задач? Давайте проверим.
DALL-E Mini
Разработчики DALL-E Mini научили алгоритм довольно точно «рисовать» по текстовому описанию. Сервис не требует авторизации и специальных настроек, а также требований к вычислительным мощностям. Нейросеть генерирует по тексту сразу девять картинок – так можно увидеть разные попытки изобразить задумку – идеальный формат, чтобы визуализировать любую даже самую безумную идею.
Вот, например, мы фантазировали о рекламной кампании BMW, приуроченной к самой ожидаемой премьере – приквелу сериала «Игры Престолов» «Дом дракона». Как вам такой визуал?
Вот еще варианты, сгенерированные с помощью DALL-E Mini:
Где попробовать: сайты Dall-e Mini и Craiyon, телеграм-бот
MidJourney
Сервис генерирует четыре варианта картинок под текстовый запрос. Некоторые результаты поражают деталями и проработкой. Правда, чтобы получить картинки, необходима регистрация в популярном у разработчиков, дизайнеров и геймеров мессенджере Discord: текст нужно направить боту в чат, а в ответ он пришлёт сгенерированные изображения. Разработчик MidJourney Дэвид Хольц неспроста выбрал доступ к сервису через мессенджер: он считает, что люди охотнее фантазируют, когда собираются вместе, и срабатывает групповой принцип работы.
Бесплатная версия MidJourney позволяет сгенерировать и скачать до 12 изображений, но не дает доступ к личному кабинету.
Мы попросили нейросеть нарисовать BMW m8 в лучах солнца, BMW m5, а также Nissan Qashqai в полях – получилось довольно качественно и узнаваемо.
Где попробовать: discord-сервер проекта
Stable Diffusion
Не так давно сервис завершил бета-тест, и теперь его могут опробовать бесплатно и почти без ограничений все желающие. Благодаря реалистичным результатам и тонкой настройке текстовых запросов данную нейросеть сразу назвали новым конкурентом главных инструментов на рынке – DALL-E 2 и Midjourney.
Нейросеть самостоятельно фильтрует изображения в зависимости от того, насколько они «красивы». Затрудняемся сказать, по каким критериям оценивается «красивое», но нам результат понравился:
Где попробовать: на сайте производителя или Hugging Face - без ограничений и регистрации
– Все протестированные сервисы довольно просты в использовании – введите нужный текстовый запрос и получите изображение. В целом, мне больше всего понравилась сеть MidJourney – на мой взгляд, она сгенерировала интересные картинки. В Discord’e можно найти большое количество ранее сгенерированных изображений и выбрать подходящее. Что касается автотематики, то на данный момент автомобили генерируются нейросетями достаточно странно – отсутствуют узнаваемые знаки (например, логотипы брендов), многие авто на изображениях имеют по 1 двери или не имеют колёс. Так что говорить о полноценной замене дизайнера нейросетями пока что рано. А вот использовать их как вспомогательные инструменты вполне реально. Сервисы могут стать огромным источником для вдохновения. Так, например, нарисованные нейросетями пейзажи выглядят достаточно реалистично и симпатично.
Мы решили немного поэкспериментировать и использовали синтез искусственного интеллекта и человека: нейросеть нарисовала пейзаж, а дизайнер поместил туда автомобиль. Результат очень даже порадовал:
hyperrealistic_surreal_hellish_landscape_red_storm
В процессе подготовки было довольно просто нагенерировать фоны из текстовых описаний и вставить в итоговое изображение автомобиль.
Что можно сказать по итогам? Конечно, нейросеть не заменит дизайнеров (особенно в автобизнесе), но уже сейчас этот инструмент может упростить им работу, решив проблему отсутствия подходящего контента на фотостоках.