Кейс Okko: борьба за трафик с “пиратскими” сайтами
Как определить в поисковой выдаче сайты с пиратским контентом? Именно на эту задачу приходится тратить множество часов специалистам из okko.tv. Мы постарались максимально оптимизировать этот процесс и сократить затраты компании, используя платформу SEOWORK.
Кейс, который мы описали в этой статье, будет актуален не только для онлайн-кинотеатров, эта проблема затрагивает и другие сайты с уникальным контентом, защищенным авторскими правами: видео, книги или софт.
Сайты с пиратским контентом быстро индексируются и выходят в ТОП-10, таким образом забирают трафик у первоисточника по нашей семантике. С этим и старается бороться Okko ― коллеги находят проекты, которые нарушают DMCA и отправляют жалобы в Google, после удаления таких проектов, позиции кинотеатра естественным образом улучшаются. Изначально все делалось вручную: выгружали слепки ТОП-100, искали сайты с нелицензионным контентом, формировали списки и отправляли жалобы в соответствующие инстанции. Этот процесс занимал много времени у специалистов, которое можно было потратить значительно эффективнее.
Мы предложили алгоритм для детекции пиратов с использованием готовых фильтров “Новички” и “Лидеры” в модуле “Конкуренты”, который значительно сокращает трудозатраты на эту задачу.
Суть алгоритма — создать списки сайтов "не пиратов" (партнерские сайты, которые забирают контент на законных основаниях) и "пиратов". После этого - смэтчить подоменно с сайтами в слепках ТОП-10.
Разметка “не пиратов”
Мы будем использовать модуль “Конкуренты”, где отображаются все сайты, которые ранжируются по нашему семантическому ядру. Таких находится 1760 сайтов — разбирать список вручную долго и сложно.
Достаточно выгрузить 100 сайтов лидеров по видимости (ТОП-100 сайтов) и разметить их вручную "пират" / "не пират". Большинство сайтов из ТОП-100 будут “не пиратами”.
Дополнительно - в файле выгрузки можно отфильтровать сайты по столбцу “конкурент” и “тип”. Если конкурент определен как “Прямой” - автоматически проставляем метку “не пират”. Если у сайта присутствует какая-то разметка в “Типе” - так же автоматически проставляем метку “не пират”. Эти данные подтягиваются с нашей БД, т.е. если сайт размечен, значит он либо есть у нас в системе, либо это один из популярных сайтов предварительно размеченных Сеоворком.
Разметка “пиратов”
Следом воспользуемся новым готовым фильтром "Новички". Благодаря этим фильтрам мы можем быстро найти сайты конкурентов, которых ранее не было видно по отслеживаемым запросам в ТОП-10.
После применения этих фильтров получаем список сайтов, практически все из которых пираты (дополнительно стоит их бегло просмотреть, но там даже из названий доменов понятно, что это какое-то очередное зеркало).
Объединяем полученные списки “не пиратов” и “пиратов”.
Выгрузка слепков ТОП-10 + мэтчинг
Сюда же следует добавить слепки ТОП-100 выдачи по запросам, где Окко в ТОП-10 и находим соответсвия с полученными данными по нашим спискам. Это также можно сделать с помощью инструментов в SEOWORK.
Из полученных слепков ТОП-100 оставляем для анализа только ТОП-10 по каждому запросу, где вытаскиваем из урлов выдачи в отдельный столбец название доменов и мэтчим их с нашими списками "не пират" или "пират".
Сайты, которые оказались по итогу неразмеченными (таких на выходе получается немного, т.к. первые 2 шага по разметке “пират” и “не пират” покрывают большинство сайтов в наших слепках ТОП-10), можно оценить по сроку жизни домена и посещаемости (молодые и щуплые сайты тоже пометим пиратами).
Таким образом мы разметили практически все сайты, которые как-то могут повлиять на значимые позиции Okko, а остаток неразмеченных доменов можно посмотреть и разметить вручную, после всех итераций таковых останется очень мало или не остается вовсе.
Итог
По итогу на выходе мы получим размеченный файл ("не пират"/"пират") по всем слепкам ТОП-10, где присутствует Окко. Из полученных слепков можно легко составить жалобу DMCA на сайты, которые мы разметили “пиратами” + прилагая к заявке сайты “не пираты”.
Полезен ли вам такой кейс?
Кейс подготовлен ведущим аналитиком SEOWORK Сергеем Горобий
Минус. Лучше делайте хороший сервис, за который захочется платить а не вот это вот все: "фильм не входит в подписку гони бабло", "у нас лицензия кончилось, мы удалили сериал", "скачать нельзя".
Принципиально не пользовался онлайн-парашей и не собираюсь.
Кейс не универсален и нужен определенной группе пользователей, если вам не не актуален, не беда.
Сервис у нас уже хороший!
Комментарий недоступен
Я как-то попробовал их очкком попользоватсья. Подписка досталась каким-то образом от сбера вроде. Дикие тормоза и лаги. Перемотал фильм и ждёшь минуту пока прогрузится. Каждый фильм кроме фильмов из 1960-х за дополнительную плату. Нет бы купить серверов чтобы нагрузку распределить, CDN по регионам сделать, а они на эту DMCA тратятся и на зп людям которые в роскомпозор и гугл жалобы строчат, да и наверняка клевещат чтобы конурентов задавить. Ушёл обратно к пиратам, даже имея у них подписку.