Привет! На связи Максим Кульгин. Моя компания xmldatafeed.com занимается парсингом сайтов более четырёх лет. Ежедневно наши роботы обходят свыше 500 крупнейших интернет‑магазинов, что приносит прибыль ~33 млн. рублей в год. Сегодня подготовили для вас список из 30 решений для самостоятельного парсинга: плагины для браузеров, приложения, облачные се…
Из десктопных программ рекомендую SiteAnalyzer ( https://site-analyzer.ru/ ) - помимо парсинга сайтов для нужд SEO (поиск битых ссылок, дубликатов страниц, анализ-мета-тегов и т.п.) умеет извлекать данные с сайтов по определенным правилам используя XPath, CSS, XQuery, RegEx. Более подробнее описание описано тут https://site-analyzer.ru/news/version-2-5-scraping/
продолжу. раз уж упомянули seo, то не обойтись и без screaming frog, xenu и netpeak spider