【发布时间】:2020-01-25 16:43:33
【问题描述】:
有人知道包含“utm_source=404Redirect&utm_medium=404Redirect”的重定向链接吗?
上下文: 我从谷歌新闻收集了多个链接,其中一个链接是“https://techknowbits.com/2019/09/04/allogene-therapeutics-nasdaqallo-earns-hold-rating-from-jpmorgan-chase-co.html”,当我尝试通过硒驱动程序或普通浏览器在浏览器中打开链接时,它会将我重定向到“https://www.marketbeat.com/stocks/NASDAQ/ALLO/?utm_source=404Redirect&utm_medium=404Redirect”。
我的问题是:
是否正常重定向?或
当网站出现 404 错误时是否会重定向?
我问这个问题,因为多个其他链接
“https://slatersentinel.com/news/2019/09/13/comparing-allogene-therapeutics-nasdaqallo-erytech-pharma-nasdaqeryp.html”也将我重定向到那个页面。
如果 404 是重定向的原因,那么我应该开始处理该错误,否则我可能最终会为每个 404 错误收集相同的数据
【问题讨论】:
标签: python selenium redirect web-scraping http-status-code-404