Страница просканирована, но пока не проиндексирована в Google Search Console: причины и решения (часть1)

Просканировано – но пока не проиндексировано 
Просканировано – но пока не проиндексировано 

Частая ошибка, поехали разбироваться.

Статус "Страница просканирована, но пока не проиндексирована" в Google Search Console (GSC) означает, что Googlebot посетил страницу, но не добавил ее в поисковый индекс. Это может быть связано с фильтрами на сайте, но не всегда является проблемой. Иногда Google просто обновляет данные или сознательно не индексирует определенные страницы.

Нужно ли волноваться?

Не все страницы должны индексироваться. Некоторые страницы могут и должны оставаться неиндексированными, например:

  • страницы результатов поиска,
  • фильтры и страницы тегов/категорий с дублированным контентом,
  • тестовые и устаревшие страницы,
  • страницы для внутреннего пользования,
  • глубоко пагинированные страницы,
  • временные страницы (акции, сезонные предложения),
  • RSS, sitemap,
  • взломанные страницы.

Если же важные страницы не индексируются, это повод искать причины.

Основные причины, по которым страницы не индексируются

  • Низкокачественный контент: дублированный, малоинформативный или бесполезный.
  • Задержка индексации: страницы недавно просканированы, но еще не добавлены в индекс.
  • Дублированный контент: страницы слишком похожи на уже проиндексированные.
  • Ограничения краулингового бюджета: Google отдает приоритет более важным страницам.
  • Спам или нерелевантный контент.
  • Проблемы с загрузкой и рендерингом: медленная отрисовка из-за JavaScript.
  • Недостаток внутренней перелинковки: страницы изолированы в структуре сайта.
  • Временный контент: сезонные страницы, которые Google считает неважными.
  • Взломанные страницы.
  • Новые сайты с большим объемом контента: Google требуется время на его обработку.
  • Перекрывающийся контент: страницы, не добавляющие ценности к уже существующему контенту.
  • Чрезмерное использование параметров URL.
  • Плохая структура URL.
  • Недавняя миграция или смена домена.
  • Переизбыток пагинации.

Иногда причины кроются в ручных или автоматических фильтрах. Это одна из самых неприятных проблем в GSC.

Что делать?

  • Улучшить контент: делать страницы уникальными, полезными и детальными.
  • Запросить индексацию вручную через GSC: если после этого страницы не попадают в индекс, возможно, наложены фильтры.
  • Устранить дубликаты: объединять схожие страницы, использовать canonical или 301-редиректы.
  • Оптимизировать краулинговый бюджет: закрыть неважные страницы в robots.txt или через noindex.
  • Удалить или переработать спам-контент.
  • Оптимизировать производительность страниц: чем быстрее загрузка, тем больше страниц Google успевает обработать.
  • Добавить внутренние ссылки: повысить связанность страниц.
  • Использовать noindex/410 или 301-редирект для устаревшего контента.
  • Удалить взломанные страницы и защитить сайт.
  • Постепенно публиковать контент на новых сайтах.
  • Объединять или улучшать перекрывающийся контент.
  • Использовать canonical для дубликатов или блокировать параметры URL.
  • Упрощать структуру URL, делая сайт более плоским.
  • Проверять 301-редиректы, обновлять sitemap и отправлять URL в GSC после миграции.

Вывод

Статус "Просканировано – в настоящее время не проиндексировано" – не всегда проблема, но требует внимательного анализа. Важно работать над качеством контента, структурой сайта и общей SEO-стратегией, чтобы повышать шансы на индексацию страниц.

2 комментария