Страница просканирована, но пока не проиндексирована в Google Search Console: причины и решения (часть1)
Частая ошибка, поехали разбироваться.
Статус "Страница просканирована, но пока не проиндексирована" в Google Search Console (GSC) означает, что Googlebot посетил страницу, но не добавил ее в поисковый индекс. Это может быть связано с фильтрами на сайте, но не всегда является проблемой. Иногда Google просто обновляет данные или сознательно не индексирует определенные страницы.
Нужно ли волноваться?
Не все страницы должны индексироваться. Некоторые страницы могут и должны оставаться неиндексированными, например:
- страницы результатов поиска,
- фильтры и страницы тегов/категорий с дублированным контентом,
- тестовые и устаревшие страницы,
- страницы для внутреннего пользования,
- глубоко пагинированные страницы,
- временные страницы (акции, сезонные предложения),
- RSS, sitemap,
- взломанные страницы.
Если же важные страницы не индексируются, это повод искать причины.
Основные причины, по которым страницы не индексируются
- Низкокачественный контент: дублированный, малоинформативный или бесполезный.
- Задержка индексации: страницы недавно просканированы, но еще не добавлены в индекс.
- Дублированный контент: страницы слишком похожи на уже проиндексированные.
- Ограничения краулингового бюджета: Google отдает приоритет более важным страницам.
- Спам или нерелевантный контент.
- Проблемы с загрузкой и рендерингом: медленная отрисовка из-за JavaScript.
- Недостаток внутренней перелинковки: страницы изолированы в структуре сайта.
- Временный контент: сезонные страницы, которые Google считает неважными.
- Взломанные страницы.
- Новые сайты с большим объемом контента: Google требуется время на его обработку.
- Перекрывающийся контент: страницы, не добавляющие ценности к уже существующему контенту.
- Чрезмерное использование параметров URL.
- Плохая структура URL.
- Недавняя миграция или смена домена.
- Переизбыток пагинации.
Иногда причины кроются в ручных или автоматических фильтрах. Это одна из самых неприятных проблем в GSC.
Что делать?
- Улучшить контент: делать страницы уникальными, полезными и детальными.
- Запросить индексацию вручную через GSC: если после этого страницы не попадают в индекс, возможно, наложены фильтры.
- Устранить дубликаты: объединять схожие страницы, использовать canonical или 301-редиректы.
- Оптимизировать краулинговый бюджет: закрыть неважные страницы в robots.txt или через noindex.
- Удалить или переработать спам-контент.
- Оптимизировать производительность страниц: чем быстрее загрузка, тем больше страниц Google успевает обработать.
- Добавить внутренние ссылки: повысить связанность страниц.
- Использовать noindex/410 или 301-редирект для устаревшего контента.
- Удалить взломанные страницы и защитить сайт.
- Постепенно публиковать контент на новых сайтах.
- Объединять или улучшать перекрывающийся контент.
- Использовать canonical для дубликатов или блокировать параметры URL.
- Упрощать структуру URL, делая сайт более плоским.
- Проверять 301-редиректы, обновлять sitemap и отправлять URL в GSC после миграции.
Вывод
Статус "Просканировано – в настоящее время не проиндексировано" – не всегда проблема, но требует внимательного анализа. Важно работать над качеством контента, структурой сайта и общей SEO-стратегией, чтобы повышать шансы на индексацию страниц.