6 способов правильно настроить rel canonical (и 8 ошибок при его настройке)

Одинаковый контент на разных страницах — плохо, за это следуют санкции. Но есть случаи, когда дубли оправданы. Разбираемся, как правильно показать поисковику канонические страницы, и какие ошибки не стоит допускать.

Бывают ситуации, когда одна и та же страница входит в несколько категорий или один и тот же сайт доступен с www и без.

В таких случаях нужно указывать, какой вариант страницы роботу считать основным, то есть каноническим, а какие дублями. Для этого придумали канонический тег — rel = "canonical", он решает проблему дублирования контента.

Каноническая страница — это основной URL. Атрибут rel = "canonical" добавляют на страницы-дубли и в нем указывают адрес канонической страницы, чтобы дать боту знать, какую страницу они повторяют.

Для использования канонического тега нужно выбрать среди дублей основной URL, вписать его в атрибут:

<link rel="canonical" href="http://site.ru/page/">

и добавить ко всем неосновным страницам.

Для добавления есть нес��олько способов.

Большинство CMS имеют встроенную функцию или плагины, которые позволяют автоматизировать настройку канонического URL.

К примеру:

настроить canonical на WordPress можно с помощью плагина Yoast SEO;
в OpenCart в настройках товара можно задать SEO URL;
в Joomla версии от 3 и выше можно включить функцию SEF. Тогда в код технических страниц вида /index.php?option добавится атрибут rel = "canonical" с указанием основной страницы с ЧПУ.

Основной способ — прописать rel = "canonical" в секцию < head > любой страницы-копии.

Например, если для страницы https://site.ru/*utm_content= канонической будет https://site.ru/, на страницу https://site.ru/*utm_content= нужно добавить код:

<link rel="canonical" href="http://site.ru/">

У PDF и других не HTML документов нет секции < head >, так что использовать предыдущий способ не получится. Если у вас есть доступ к настройкам сервера, можно указать канонический тег в заголовке HTTP с использованием .htaccess или PHP.

При запросе дублирующего файла сервер должен отдавать в заголовке ссылку на оригинальный файл:

Link: <http://example.com/file.pdf>; rel="canonical"

К примеру, вы составили руководство, выложили его в блог и отдельно оформили в PDF-файл для скачивания, который разместили в подкаталоге http://site.ru/blog/*. HTTP-заголовок для этого руководства в PDF может выглядеть так:

HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <http://site.ru/blog/canonical-tags/>; rel="canonical"

Поисковики по умолчанию думают обо всех ссылках в XML-файле как о канонических. У Google есть требование включать в Карту сайта только канонические адреса страниц.

Обратите внимание, что Карта не свод правил для поисковых ботов, а список рекомендаций, который поисковики могут проигнорировать.

Отвести трафик и ссылочный вес от дублей к канонической страницы можно с помощью 301 редиректа. Этот способ можно использовать, если сайт, к примеру, доступен по нескольким адресам:

https://site.ru/

http://site.ru/

http://www.site.ru/

https://www.site.ru/

Можно выбрать в качестве основного https://site.ru/, а со всех остальных настроить перенаправление.

Есть сигналы, которые поисковик использует для определения канонического адреса. Если вы указали канонической одну страницу, а по совокупности факторов другая кажется поисковику более подходящей, он не будет вас слушать.

К примеру, между адресами HTTPS и HTTP Google выберет HTTPS, а еще он может предпочесть привлекательный с его точки зрения URL. Ссылки с одной страницы на другую тоже считаются сигналами для каноникализации.

Подписывайтесь на наш ВК и Телеграм, чтобы узнавать последние новости SEO и подсматривать новые фишки продвижения.

Неправильной настройкой можно навредить индексированию страниц. Разберем несколько типичных ошибок оптимизаторов.

Для одной страницы нужно указать один канонический адрес. Если указано несколько, бот либо проигнорирует страницу вообще, либо примет к сведению первый указанный URL.

Проверяйте, как плагин CMS реализует canonical, иногда из-за неправильной настройки он может указывать несколько адресов.

Похожий пункт, но речь идет не о нескольких канонических адресах для одной страницы, а в о разных, указанных разными способами.

Если вы используете несколько способов указать канонический тег, например, в HTTP-заголовке и в секции < head >, ссылка на основную страницу должна быть одна и та же.

Бот не будет учитывать канонический адрес, если для страницы, которую вы указали основной, настроена какая-то своя основная страница. Например, для адреса site.ru/1 канонической ссылкой указана site.ru/2, а для нее указана site.ru/3.

Тег rel = "canonical" должен находиться только в секции < head >. Если указать его в < body > документа, боты его проигнорируют. Или даже могут проигнорировать всю страницу.

Лучше перепроверить: даже если вы поставили canonical ближе к началу документа, секция < head > может закрыться раньше, например, из-за вставок JavaScript, контейнеров < iframe > или незакрытых парных тегов. Тогда canonical окажется за пределами < head > в секции < body >.

Если для всех страниц пагинации канонической указать первую, бот не проиндексирует остальные. Есть два варианта:

сделать канонической страницу «Показать все», если она есть;
для каждой страницы поставить ее же URL в качестве канонической, если нет общей страницы.

Но если вы считаете, что наличие всех страниц пагинации в выдаче плохо повлияет из-за повторяющихся Title и Description, не ставьте канонический тег вообще и закройте их для индексации.

Используйте noindex, follow для страниц пагинации и для /page укажите disallow в файле robots. Такая настройка означает, что индексировать нельзя, а переходить по ссылкам можно.

Тег canonical и 301 редирект кажутся похожими — перенаправляют бота на основную страницу. Но не стоит использовать canonical вместо редиректа.

Редирект переводит весь трафик на один URL, а при использовании rel = "canonical" страница откроется, будет активной и сможет получать трафик, но не появится в индексе.

Ошибкой будет указать главную страницу в качестве канонической для всего сайта. Боты могут проигнорировать все страницы, кроме главной.

Если канонический URL закрыт от индексирования или по другой причине недоступен для поискового бота, он не сможет участвовать в формировании выдачи. В этом случае бот возьмет доступный неканонический URL.

Есть специальные сервисы, которые помогают быстро узнать канонический URL страницы. Например, инструмент Проверка Canonical онлайн. Введите в поле адрес страницы, а он определит, является ли страница канонической, и покажет, какой URL стоит в rel="canonical" страницы.

Поделитесь в комментариях, о каких способах настройки я забыл упомянуть, и какие еще ошибки вы встречали в своей практике!

6 способов правильно настроить rel canonical (и 8 ошибок при его настройке)

Зачем использовать rel canonical

Как настроить canonical правильно

1. С помощью плагина CMS

2. Между тегами любой HTML-страницы

3. В заголовке HTTP

4. В файле Sitemap

5. Через 301 редирект

6. Через сигналы поисковиков

Неправильно указан canonical: топ-8 популярных ошибок настройки

1. Использование нескольких канонических ссылок для одной страницы

2. Настройка разных канонических URL одной странице

3. Настройка цепочки канонических URL

4. Размещение rel = "canonical" не в секции head

5. Указание первой страницы пагинации как канонической

6. Использование канонических URL вместо 301 редиректа

7. Выбор главной как канонической для всех страниц

8. Закрытие канонической страницы от индексирования

Как проверить canonical