Круглосуточный «магазин на диване»: как китайские бренды выручают тысячи долларов благодаря «дипфейкам» стримеров
Достаточно отснять минутный ролик с настоящим ведущим и заплатить разработчику $1000.
Конспект заметки MIT Technology Review.
В Китае основной канал для продвижения товаров — это прямые трансляции в интернете, пишет MIT Technology Review. Опытный ведущий может увеличить оборот бренда более чем на $1 млрд всего за один вечер, но чтобы обучать таких стримеров, а потом их удерживать, нужно много денег.
У малого бизнеса бюджет, как известно, ограничен, да и крупный стремится урезать расходы, так как темпы экономического роста в стране замедляются. Вот только платить большие гонорары ведущим вовсе необязательно. С 2022 года в Китае появляется всё больше компаний, которые помогают магазинам создавать «дипфейки» для прямых трансляций.
Виртуальные аватары могут рекламировать товары и анонсировать скидки без перерыва на обед и сон. А двигаться у них будет не только рот, но и тело.
Один из таких разработчиков — это основанный в 2017 году стартап Silicon Intelligence из Нанкина. Ещё в 2020 году, чтобы создать реалистичного цифрового клона, ему требовалось как минимум получасовое видео с реальным ведущим. В 2023-м компании достаточно минутного ролика.
Раньше сценарии для «магазина на диване» писали сами магазины, теперь же и их можно сгенерировать с помощью языковых моделей, так что бренду останется только указать названия товаров, цены и проверить, что нейросеть не допустила ошибок в «скрипте».
Стоимость базового «дипфейка» — примерно 8000 юаней ($1096 по курсу на 30 сентября 2023 года). Но цена может вырасти на несколько тысяч, если клиенту нужен более «продвинутый» ведущий: например, тот, кто сможет распознавать комментарии в режиме реального времени и отвечать на них, используя информацию из базы обучающих данных.
По словам Silicon Intelligence, за дополнительную плату их аватары смогут изменить даже маркетинговую стратегию — в зависимости от того, сколько зрителей смотрят эфир. (Компания не приводит детали, но, возможно, ИИ-стример сможет предложить специальные скидки, если аудитория большая — vc.ru.)
В аналогичном ИИ-стартапе — Xiaoice — говорят, что обучают виртуальных стримеров на дата-сете из сотни роликов с типичными повадками и жестами реальных ведущих. Когда последние приветствуют зрителей и просят их подписаться, они, скорее всего, показывают пальцем на верхнюю часть экрана, поскольку там располагается кнопка подписки в большинстве приложений. А когда демонстрируют товар, то указывают на корзину снизу.
«Наши аватары используют эти приёмы, чтобы их язык тела не противоречил тому, на что они ссылаются. Будет странно, если стример просит о подписке, хлопая в ладоши», — говорят в Xiaoice. Там виртуальный ведущий тоже стоит около $1000 и при необходимости сможет «предложить» заказчику больше опций. Например, спортивному комментатору Лю Цзяньхону создали клона, который мог в прямом эфире сообщать результаты матчей и свежие новости.
Конечно, внимательный и придирчивый зритель заметит, что иногда движения губ виртуального актёра не соответствуют произнесённым звукам. И вряд ли такие аватары смогут в ближайшее время заменить успешных инфлюенсеров. Но их умений уже хватает, чтобы «подсидеть» стримеров среднего уровня и занять эфир ночью, когда зрителей значительно меньше, говорят участники рынка.
Допустим, компания работает с десятью ведущими. Уровень их эффективности наверняка будет разным.
Скорее всего, двое-трое из них приносят 70-80% всех продаж. В таком случае нет смысла платить остальным шестерым-семерым за низкие показатели и несущественный вклад, если можно сократить затраты, разработав одного виртуального.
Один стример Xiaoice, например, принёс клиенту заказов на сумму более 10 тысяч юаней ($1370) всего за час работы. А в сумме ИИ-ведущие уже сгенерировали брендам миллионы долларов. Судя по тому, что в 2023 году средняя ставка стримеров снизилась по сравнению с 2022 годом на 20%, компании, видимо, начинают осознавать преимущества.
Мелкие недочёты в мимике и телодвижениях — не единственная проблема таких клонов. Разработчики получают немалую долю заказов от мебельных брендов. Те, в свою очередь, часто демонстрируют товары, которые реальный человек протестировал бы в прямом эфире: посидел бы на диване, попрыгал на кровати, чтобы показать, как пружинит матрас, отрегулировал бы высоту офисного стула. Виртуальному ведущему это пока не под силу.
Не до конца ясно и то, какие законы введёт правительство и смогут ли бренды так же свободно использовать «дипфейки» в будущем. Но разработчиков это не останавливает. Silicon Intelligence, например, собирается наделить роботов «эмоциональным интеллектом», чтобы они радовались, когда зрители пишут хорошие комментарии, и расстраивались, если их критикуют.
В планах также научить клонов взаимодействовать друг с другом и выпустить 100 млн цифровых стримеров уже к 2025 году. Сейчас у Silicon Intelligence их 400 тысяч, так что работы впереди предстоит немало.