Интерфейс под алгоритмы: почему рекомендации TikTok такие затягивающие
Предприниматель Юджин Вей рассуждает, как слаженная работа механизмов китайской соцсети позволяет системе непрерывно учиться и удерживать более 800 млн пользователей.
Массивы данных и машинное обучение
Удивительно, насколько с недавнего времени улучшилось машинное обучение только за счёт тренировки на больших массивах данных, пусть даже новые алгоритмы не сильно отличаются от старых. Один из примеров — модель GPT-3. Она пишет поэмы и техническую документацию, генерирует табулатуры и решает математические задачи.
В некоторых областях данных для обучения много: корпусы текстов для языковых моделей, фотобанки для визуального ИИ. Но у TikTok поначалу не было ни базы с короткими видео (с мемами, танцующими детьми и рекламой брендов), ни данных о том, нравятся ли они пользователям. Сервису оставалось самому стать источником тренировочных массивов.
Интерфейс и алгоритмы рекомендаций
Когда речь заходит об алгоритмах китайской соцсети, многие представляют себе волшебный фрагмент кода. Но знатоки отрасли считают, что в целом TikTok подходит к решению задач машинного обучения сходно с остальными компаниями.
Для сервисов вроде TikTok успех во многом зависит от того, как работают алгоритмы машинного обучения. И чтобы они работали на вас, сначала нужно поработать над ними — помочь им «увидеть», замечает Веи.
Перед тем как видео попадёт в ленту рекомендаций пользователя, его посмотрит сотрудник отдела по контенту и расставит метки:
- Что на видео: танцы, пение под фонограмму, видеоигры, котёнок, еда.
- Кто на видео: мужчина или женщина, сколько их, какого они возраста.
- Где происходит действие.
- Какие фильтры и эффекты.
Видео также анализирует система ИИ, причём иногда даже во время съёмки: некоторые фильтры в TikTok фиксируют изменения мимики и движения тела.
На начальной странице TikTok отображается только одно видео. Механизм сервиса похож на бесконечную ленту, но на деле у каждого ролика своя страница. Пока воспроизводится один, другие загружаются в фоновом режиме. Такой метод позволяет приложению анализировать отношение к конкретному ролику.
Каждое действие — сигнал для системы:
- Если пользователь не досмотрел видео и перешёл к следующему, значит, оно ему не понравилось.
- Повторное воспроизведение, интерес к музыкальному сопровождению или решение поделиться указывают на увлечённость.
- Посещение страницы автора и подписка — на высокий интерес.
Ещё алгоритм учитывает, что TikTok уже знает о пользователе:
- Предыдущие действия.
- Демографические и психографические характеристики.
- Где он смотрит видео и на каком устройстве.
- Какие пользователи на него похожи.
TikTok собирает достаточно данных даже за короткое время. Ролики небольшие — и пользователь точно посмотрит несколько. А пролистывать нудные видео ему даже приятно, ведь он знает: в будущем алгоритм учтёт предпочтения.
Бесконечная прокрутка и негативная оценка публикаций
Ленты многих соцсетей давно работают на алгоритмах. Чаще всего они устроены по принципу бесконечной прокрутки и отображают сразу несколько элементов. Но в таком случае алгоритм не узнает, какая публикация привлекла внимание пользователя и как он к ней отнёсся.
Возможно, он забыл поставить отметку «Нравится» или хотел возразить, но передумал, потому что автор — его друг или коллега. Алгоритм не может распознать отрицательный отклик, нет негативной обратной связи. Некоторые платформы позволяют указывать на содержание нежелательного характера, но эти функции «спрятаны», и поэтому ими редко пользуются.
Такие ленты формируют Facebook и Instagram (оба запрещены в России), а также Twitter. Они ориентируются в первую очередь на социальные графы: учитывают возраст, родной город, подписки на сообщества и предпочтения «друзей». Недостаток — интересы пользователя могут не совпадать с интересами «друзей», часть из которых он едва знает.
Reddit использует графы интересов и поэтому разработала механизм отрицательных оценок. Главная задача площадки — удержать пользователей за счёт увлекательного контента, а для этого необходимо отсеять неподходящий.
Эту же цель ставит TikTok, хотя очевидной негативной отметки для видео в нём не предусмотрено. Алгоритм учится считывать отрицательную реакцию сам — по отсутствию положительного отклика и досрочному перелистыванию. Впрочем, за долгим нажатием на видео всё же спрятана функция «Не интересно».
Восприимчивость алгоритма вынуждает создателей контента завлекать зрителей. Один из популярных приёмов — использование «вирусных» песен. Скорее всего, пользователь прослушает фрагмент несколько раз и дождётся кульминации. Но в видео её может и не быть. Поэтому авторы нередко добавляют «результат в конце» или «обязательно досмотри», чтобы создать интригу.
Бесконечно прокручивающейся лентой разработчики Facebook (запрещён в России) и Twitter надеются упростить взаимодействие с приложением: при желании пользователь прокрутит полтора десятка публикаций одним касанием. В TikTok видео листают «смахиванием». Не так удобно, но точные рекомендации это компенсируют.
Пользователям Twitter, к примеру, нередко приходится «игнорировать» и блокировать неугодных комментаторов, «чистить» подписки и отписывать от себя нежелательных читателей. Они часто недовольны, что в их ленте показывают публикации, понравившиеся другим.
Это указывает на плохо отлаженную работу сервиса. Если бы алгоритмы распознавали интересы конкретного пользователя, ему бы не пришлось «игнорировать» цепочки публикаций и блокировать авторов. Скорее всего, он бы с ними не столкнулся.
Кроме того, ориентируйся разработчики на графы интересов, а не социальные графы, Twitter мог бы обойтись и без подписок — занимательный контент подбирался бы подобно рекомендациям TikTok.
Такое проектирование интерфейса позволяет алгоритмам китайской соцсети постоянно учиться, и поэтому сервисам вроде Reels или Triller может быть трудно её догнать.
Украду картинку, посты Морейниса комментировать
Все хейтят телевизор. Алгоритмы тик-тока - это будущее того же самого «нового» телевидения.
во-во, и главное гоооордые - я не смотрю телик, он для зомби!
(Потом пошел в инсту и тик-ток)
Комментарий недоступен
Вот бы тик-ток после пользования им мог сказать насколько я дебил, в процентах.
если используешь ТТ, то 100% - Да