1. Фильтр по дубликатам контента (Duplicate Content Filter): Google стремится не индексировать или не отображать дубликаты в результатах поиска. Он индексирует веб-страницы, чтобы определить качество и уникальность их содержимого. Если обнаруживает, что одна страница дублирует другую, то может удалить дублирующийся контент из индекса. Для этого поисковик использует комбинацию алгоритмов. Они учитывают не только сходство текста, но и другие факторы: структуру страницы, метаданные и ссылки. Таким образом, присвоение статуса «дубликат» зависит и от даты индексирования страницы.
Мда, работа ради работы.
Сами себе придумали проблему, нашли для неё обоснование - мол вот, есть алгоритмы и патенты, для борьбы с дублицированным контентом, внушили себе и заказчику, что всё это не зазря и в путь.
Ну честно, выглядит смешно, будто нужно было чем-то набить отчеты, вот вы и придумали борьбы с ветряными мельницами. Особенно позабавило то, что в обосновании ради "научности" и массовости втиснуты причины, которые вообще никак не связаны с дублицированным контентом
я поржал. Когда пришла претензия от Антов. "УУУууу вы украли наш топовый контент :). "
Личный опыт:
1) Копипаст с моего инфосайта в составе сборной портянки на 50-100к символов. Слал DMCA-абузы в Гугл. Где-то 30% абуз одобрили, остальные забраковали - мол, на странице на которую ты жалуешься не тот контент, иди лесом. Очень триггерила такая реакция с учетом того, что тот же Гугл без всяких разбирательств может удалить по DMCA страницу, например, с html-картой сайта (т.е. по дефолту не способной содержать объекты чужих авторских прав), на которую пожаловались какие-нибудь клоуны из «юридической компании по борьбе с пиратством и защите авторских прав», которые парсят выдачу, шлют абузы на автомате и даже не проверяют на какие урлы они ссылаются в своих абузах и какой там контент. И потом фиг это решение опротестуешь - все твои аргументы "да вы сами посмотрите, ну где там вообще чужой контент?" будут просто в мягкой форме сливать. А у меня обоснованные жалобы и по большей их части все равно приходил отказ.
2) Коммерческий сайт, с которого многие конкуренты пытаются воровать структуру и сделанные специально под клиента картинки и анимации. Отправляли воришкам претензии по электронной почте. На претензии среагировала только одна контора - извинились, передали обращение подрядчикам из веб-студии, занимавшейся созданием и поддержкой их сайта. Те удалили часть спорного контента, а потом совершили гениальное - ограничили доступ с моего IP (видимо, выцепили из письма) к сайту своей веб-студии. Смысл этого поступка я до сих пор не могу понять, ну да земля им пухом. Остальные конкуренты мои претензии просто игнорировали. Клиенту же было лень рассылать им официальные претензии от лица своей компании, да и подтверждением своих прав на созданный под него контент он в свое время не озаботился.
3) Тот же клиент, просьба защитить сайт от воровства не только графического контента, но и текстов (описания товаров). Естественно, это невозможно, потому что если контент доступен поисковому роботу - значит, его можно и спарсить. Но чтобы как-то успокоить человека - написали и подключили JS-скрипт, который отслеживает выделение текста на странице и в этот момент подменяет в тексте все русскоязычные символы на схоже выглядящие из английской раскладки. Эффективность этого решения доподлинно неизвестна, но тут мы переиграли сами себя. Ибо оказалось так, что сколько ни рассказывай собственным контентщикам про этот скрипт и про то, что нельзя в ходе каких-то работ копипастить тексты с публичной части сайта - на эти предупреждения нет-нет, да забивается. И со временем у нас появились страницы и сквозные блоки с кашей из подменных символов. В итоге пришлось писать еще и скрипты для поиска поврежденных кусков текста.
Статья о том как побольше снять с клиента бабла, и обосновать. Клиент ещё не понял как его развели!))) "Кнопка бабло"(с)
Последнеее - это мем какой-то? Есть ориг?
1. Сразу возник вопрос к аналитике - как можно сравнивать посещаемость недели с 3 дня?! Выводы некорректные. Попробуйте поставить корректные даты и проанализировать - может все хорошо было, и зря была проделана работа?
2. Как доказать, что тексты написаны вами? Может вы не также все скопировали, но немного раньше других? Часть провайдеров просит нотариального подтверждения, что тексты ваши. Скрины с сайта - да там дату можно поставить хоть от 1900 года - не самый сильный аргумент.
1. да реально. Трафик проверили с 8 по 30 августа. и Решили что он падает?