Нейросети: практический угол зрения

Часть проекта для производителя мейкапа
Часть проекта для производителя мейкапа

До прошлого года искусственный интеллект занимал умы в основном ученых и IT-специалистов, но в 2023 инструменты на базе ИИ сделали огромный скачок, став важнейшим фактором развития бизнеса, и это только начало:

  • $400+ млрд – объем рынка искусственного интеллекта к 2027 году,
  • 37,3% – годовой прирост ИИ с 2023 по 2030 год,
  • 90% интернет-контента будет создаваться при помощи ИИ к 2026 году.

Рынок труда также изменится, и всем придётся освоить новые навыки: от 75 млн до 375 млн человек (по разным оценкам) переквалифицируются к 2030, и к 2025 году появится 90+ млн рабочих мест, связанных с ИИ.

Эта революция по масштабам сравнима с компьютеризацией 90‑х, когда новая технология полностью преобразовала все сферы жизни, оставив за бортом всех, кто не принял перемен. Но сегодня всё намного быстрее.

Весь год не утихали споры о невиданных возможностях и опасностях нейросетей, кто-то смеялся над их несовершенством, по интернету ходили мемы про шесть пальцев… Но пришло время от неприятия или восторга перейти в практическую плоскость: как именно приспособить новые инструменты, какие у них ограничения и какая в них польза в каждом конкретном случае.

Для начала: общий контекст использования ИИ в России.

  • Самые распространенные сервисы – иностранные, а это значит, что их легальное использование сильно ограничено: VPN + оплата картами зарубежных банков + незаконность работы с персональными данными, а также со всеми, что составляют коммерческую и государственную тайну. Некоторые люди даже в госорганизациях используют ChatGPT, но это до тех пор, пока службы безопасности не задумываются, что данные обрабатываются на серверах в США. И, конечно, любая иностранная корпорация может по своему усмотрению в любой момент ещё более ограничить и вовсе запретить использование своих сервисов в РФ.
  • Вероятны ограничения поставок иностранного оборудования для профессионального использования. США уже ввело подобные санкции для Китая. Сейчас львиная доля рынка у американской Nvidia – на их оборудовании и софте производятся почти все вычисления в области искусственного интеллекта и альтернатив пока не видно. Простые задачи можно делать на игровых видеокартах, но для масштабных проектов они не годятся.
  • Россия делает ставку на ИИ на самом высоком уровне, но отставание пока весьма заметно. Яндекс делает большие успехи, но добиться от него практически полезных текстов сложно. При этом у нас есть реальная возможность стать одной из ведущих стран в этой высокотехнологичной области. Не стоит забывать, что собственная интернет-инфраструктура есть только у США, России и Китая, у остальных – отдельные программы или сайты.
  • Велик риск монополизации отрасли: вспомним пассажирские перевозки – как хорошо все начиналось для пользователей, когда на рынке появился Яндекс такси, и что происходит с ценами сейчас, когда он стал почти монополистом. Для устойчивого развития бизнес-сообщества нужно несколько сильных независимых локальных игроков.
  • Наибольшие перспективы – у систем на базе open source (с открытым исходным кодом) решений. Это реальная альтернатива закрытым продуктам западных корпораций. Каждый может собрать и «допилить» продукт для себя или клиента из легально доступных решений. Это делает большинство компаний, ведь создать полностью свою нейросетевую экосистему уровня ChatGPT или Stable Diffusion не проще, чем написать альтернативу Windows с нуля.

Вот в таком контексте будет происходить выбор нейро-решений для каждого бизнеса: нахождение собственного баланса между возможностями с одной стороны, легальностью, надежностью и безопасностью с другой. Итак, что же можно делать с помощью визуальных генеративных нейросетей здесь и сейчас?

Кейс 1: Гламурная съемка со множеством моделей

Пример рекламных банеров
Пример рекламных банеров

Задача

Сделать комплект фотоматериалов для использования в рекламе премиального угля для кальянов. Произвести несколько десятков качественных изображений с разными моделями в разных премиальных локациях, к тому же, учитывая необходимость использования дорогой одежды и аксессуаров — очень дорого. Дополнительное ограничение — дым: чтобы получались красивые клубы дыма, нужно проветривать помещение после каждого кадра, иначе получится просто невнятный туман. Бюджет на подобную съемку измеряется сотнями тысяч рублей, что в данном случае было неприемлемо.

Решение

Мы подобрали стилистические референсы, на их основании создали "мир бренда", описав его в основном промпте (это текстовая задача для нейросети) и необходимых настройках для генерации. Это дало возможность далее задавать ситуации, локации, параметры моделей, но так, чтобы все это выглядело в едином стиле и могло продолжаться бесконечно — для разных аудиторий и рекламных носителей. В этом проекте мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные решения, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации изображений любого нужного размера.

Еще интересный нюанс этого проекта: для того, чтобы найти наиболее подходящие параметры, мы провели жесткое тестирование восприятия нейрофотографий в сравнении с обычными, подав 24 работы на несколько фотоконкурсов. 2800+ фотографов и любителей фотографии, то есть не случайных, а разбирающихся в теме людей, не только не распознали, что изображения сделаны с помощью нейросетей, но оценили их выше большинства работ других участников конкурса. Анализ статистики по голосованию за каждое изображению помог нам создать еще более вовлекающие образы.

Результат

У клиента есть база качественных изображений на несколько месяцев рекламной кампании, и, что немаловажно, возможность очень быстро сделать дополнительные для ситуативных рекламных кампаний, ведь такую съемку за сутки обычным способом не провести.

Кейс 2: История с идеальной резкостью

Пресс-волл высотой 2 метра
Пресс-волл высотой 2 метра

Задача

Создание изображения для оформления зала в творческом кластере «Арт-муза» необычным пресс-воллом на время проведения театральной конференции «Мнемотеатр», которая реализована в рамках гранта Президента Российской Федерации для поддержки творческих проектов общенационального значения в области культуры и искусства. «Мнемотеатр» – это интенсив-курс для специалистов сферы культуры, студентов и педагогов творческих вузов, участников театральных студий, посвящённый созданию, сохранению и распространению театрального наследия. Особенность задачи: большое изображение должно было хорошо восприниматься на любом расстоянии, а также на фотографиях в соцсетях, когда люди сделают селфи на его фоне.

Решение

Мы выбрали такой вариант только благодаря нейросети: издали виден древнегреческий амфитеатр, преходящий в современный город, а вблизи амфитеатр состоит из мельчайших деталей – дороги, мостов, машин и деревьев. Мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные варианты, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации огромного (11000 х 11000 пикселей) детализированного изображения.

Результат

Результат поражает воображение (моё, как минимум)). Действительно, мы привыкли, что изображение для восприятия издали (наружная реклама, например) вблизи выглядит не очень четко и наоборот. А тут: чем ближе подходишь, тем больше видишь деталей. Чудеса технологий!

Кейс 3: Самостоятельное создание изображений для упаковок и рекламы

Задача

Производитель пищевой продукции постоянно создает множество фотографий для упаковок и рекламы в своей дизайн-студии, но она загружена текущими задачами, а нанимать каждый раз внешнего подрядчика дорого и требует дополнительных ресурсов для управления проектами. К тому же, дизайн и фотография – важное конкурентное преимущество, и их надежнее делать внутри компании.

Решение

В данном случае пошли еще дальше по пути оптимизации производственного процесса, и установили у клиента рабочее место для самостоятельной генерации изображений с необходимым для его деятельности набором библиотек и настроек.

Результат

Дизайн команда получила нейро-помощника, которого можно использовать 24/7. Это очень удобно – ставишь задачу и переключаешься на другой проект или идешь домой. Потом смотришь сгенерированные варианты и выбираешь нужный или немного уточняешь задачу. Это намного дешевле дополнительного дизайнера, ретушера и фотографа со всем комплектом необходимого им оборудования. И ещё важный нюанс – настоящая еда редко бывает настолько идеальна, как на фотографии, каждый кадр надо ретушировать. Теперь большинство изображений создаются готовыми, «без фотошопа», это дает дизайн-студии возможность больше времени уделять поиску креативных решений.

В первую очередь, нейро продакшн — замена не творческой, а коммерческой фотосессии. Под натиском новых технологий традиционные жанры бизнес фотографии будут умирать один за другим. Первый кандидат – съемка всех новых (неиспользованных) предметов и объектов: уже сейчас в недвижимости и большинстве других бизнесов используется 3D графика вместо фотографий. Исключение: «вторичка» – съемка использованных объектов и вещей, так как важно показать реальное состояние товара (машины, например). Репортаж не умрет, скорее всего, никогда – в нем важен сам факт съемки. Пока держится традиционная рекламная фотосессия с людьми. Но лёд уже тронулся, ведь дешевые фотобанки с одинаковыми фотографиями всем уже надоели и больше не «цепляют», а уникальные фотографии – это долго и дорого. К тому же с нашего рынка ушли качественные международные фотобанки, которые порой обеспечивали разумный баланс между ценой и качеством.

В этой статье описаны лишь 3 из множества проектов последнего полугодия, но видно, что самые невероятные прорывы нейросети несут в креативные индустрии: театр, архитектуру, моду, дизайн – тысячекратно умножая творчество человека. Вот где настоящие чудеса!

Подул ветер перемен, подставляйте паруса!

Георгий Безбородов

Партнер 1Neuro.pro – профессиональные нейрорешения для бизнеса, основатель агентства устойчивого маркетинга Time4Brand, фотохудожник, фотограф. Закончил МАрхИ. В маркетинге с 1994: ADV Group, Grey, BBDO, Proximity, Yourbrand. Многократный призёр фестивалей рекламы и фотографии, член СФР, РГО, СФДП, НАПФ.
Частично опубликовано в журнале ОПТИЧЕСКИЙ MAGAZINE
№1 (88) 2024, Международное издание.

33
7 комментариев

Очень познавательно, спасибо!

2
Ответить

Использование ии в таких сферах упрощает жизнь в разы, поскольку даже используя профессиональную съемку и работу с фотошопом не всегда можно добиться желаемого результата реализации идеи, которая у тебя в голове

1
Ответить

и, что важно для меня - можно мысль реализовать, пока она не отступила под натиском ежедневных дел. съемку пока организуешь - месяц пройдет)

1
Ответить

возможности искусственного интеллекта еще поразят рынок ,уже сейчас корректируются области, в которых раньше иначе сделать нельзя было

1
Ответить

да, лично у меня даже мозги начинают иначе работать от общения с ии - кроме моей и вообще человеческой логики есть и иная... )

1
Ответить

Нужно понимать какие ограничения могут существовать при использовании нейросетей в бизнесе

1
Ответить

основное - что люди пока не понимают его ограничений - все знают, что можно сделать фотошопом, а что нельзя - а тут совершенно новый набор можно и нельзя. во многих поектах поэтому порой именно это уточннение границ занимает некоторое время.

1
Ответить