Как мы ищем соулмейтов?

Что такое Мэтч и как он работает — простыми словами о самой главной особенности Инкаста расскажет наш специалист из отдела машинного обучения — Федор. Ставь ЛАЙК, если хочешь увидеть, как будет выглядеть ТВОЙ мэтч!

Сегодня мы несколько глубже погрузимся в основной инструмент нашего сервиса — Мэтч и его алгоритмы.

Страница Мэтч
Страница Мэтч

Сама страница «Мэтч» представляет собой четыре раздела, в которой содержатся карточки людей - те самые мэтчи. Каждый раздел сформирован на основании того, как список мэтчей отображается у каждого пользователя:

  1. Подходят Вам — непосредственно ваш идеальный список соулмейтов. Обратите внимание, что на этой странице представлен только ваш личный список соулмейтов (возможно у другого человека есть более подходящие кандидаты и тогда вы можете на войти в 10ку его списка)
  2. Подходите им — анкеты людей, которым в мэтчах выпала ваша анкета.
  3. Идеальный мэтч — ваши анкеты есть друг у друга в списке, и взаимное совпадение составляет больше 50%.
  4. Скрытые — пользователи, которых вы предпочли скрыть из выпадающего списка анкет.

Помимо самих разделов, вы можете самостоятельно уточнить критерии, по которым ищете собеседника, партнера, или коллегу: начиная от пола и заканчивая конкретными интересами. В этом помогут фильтры, которые мы для вас подготовили :)

Более подробный визуал вы сможете увидеть уже совсем скоро!

Как мы ищем соулмейтов?

Но как же работает наша рекомендательная система?

Актуальный алгоритм базируется на данных с нескольких источников:

  1. Анкета — без неё «Мэтч» в принципе не будет работать! Здесь вы помогаете нам определить ваш тип личности, бытовые особенности, а также интересы. В будущем мы, возможно, добавим ещё что-нибудь.
  2. Сторонние сервисы — данные, которыми вы делитесь исключительно с вашего согласия. С помощью них мы получаем информацию о пабликах, на которые вы подписаны. Алгоритмы изучают их описание, чтобы понять ваши вкусы и интересы: мемы, внеучебные активности, новостные ленты и так далее.

Каждый из этих источников проходит предварительную обработку (то, что мы называем препроцессингом данных) и далее скармливается нужным алгоритмам. Где-то мы используем более простые подходы, например сингулярное матричное разложение (SVD), а где-то полноценные нейронные сети. Так, при обработке данных из VK мы применяем модифицированную версию BERT, которая предназначена для анализа и предварительной обработки описаний пабликов.

В целом, под капотом этой чудо-машины лежит математика, которая дает возможность сравнить данные пользователей, получить некоторую величину сходства (similarity) и понять, насколько вам подойдет тот или иной человек. Мы данную величину выражаем в процентах и показываем на карточке пользователя.

Обобщенно, работает все как-то так. А подробнее вы уже и так прочитали :)
Обобщенно, работает все как-то так. А подробнее вы уже и так прочитали :)

То, что реализовано в Мэтче уже сейчас — лишь часть того, что мы хотели бы вам продемонстрировать. В дальнейшем мы подключим больше способов рассказать о себе, обязательно появится возможность поделиться любимыми фильмами и сериалами, играми, а также музыкой.

Мы уже на низком старте и совсем скоро дадим возможность попробовать Inkast каждому из вас. Следите за новостями!

22
Начать дискуссию