【问题标题】:URL is redirecting to another URL containing utm_source=404Redirect&utm_medium=404Redirect?URL 正在重定向到另一个包含 utm_source=404Redirect&utm_medium=404Redirect 的 URL?
【发布时间】:2020-01-25 16:43:33
【问题描述】:

有人知道包含“utm_source=404Redirect&utm_medium=404Redirect”的重定向链接吗?

上下文: 我从谷歌新闻收集了多个链接,其中一个链接是“https://techknowbits.com/2019/09/04/allogene-therapeutics-nasdaqallo-earns-hold-rating-from-jpmorgan-chase-co.html”,当我尝试通过硒驱动程序或普通浏览器在浏览器中打开链接时,它会将我重定向到“https://www.marketbeat.com/stocks/NASDAQ/ALLO/?utm_source=404Redirect&utm_medium=404Redirect”。

我的问题是:

是否正常重定向?或

当网站出现 404 错误时是否会重定向?

我问这个问题,因为多个其他链接

"https://technewsobserver.com/news/2019/09/14/0-54-eps-expected-for-allogene-therapeutics-inc-nasdaqallo-this-quarter.html",

"https://sundanceherald.com/2019/08/30/analysts-expect-allogene-therapeutics-inc-nasdaqallo-will-post-earnings-of-0-54-per-share.html",

https://slatersentinel.com/news/2019/09/13/comparing-allogene-therapeutics-nasdaqallo-erytech-pharma-nasdaqeryp.html”也将我重定向到那个页面。

如果 404 是重定向的原因,那么我应该开始处理该错误,否则我可能最终会为每个 404 错误收集相同的数据

【问题讨论】:

    标签: python selenium redirect web-scraping http-status-code-404


    【解决方案1】:

    utm_* parameters 来自(总是?)Google Analytics。 您在请求这些 url 时收到 404 还是只是在 url 中看到 404?

    【讨论】:

    【解决方案2】:

    UTM 参数

    Urchin Tracking Module (UTM) parameters 是 URL 参数的不同变体,用于跟踪跨流量来源和发布媒体的在线营销活动的有效性,由 Urchin 引入,现在由 Google Analytics 支持开箱即用。 URL 中的 UTM 参数标识将流量引向特定网站的活动,并将其归因于浏览器的网站会话以及之后的会话,直到活动归因窗口到期。收集到的 UTM 参数可以通过分析工具进行解析,并用于生成必要的报告。

    例如,在下面的示例url中:

    https://www.example.com/page?utm_content=buffercf3b2&utm_medium=social&utm_source=facebook.com&utm_campaign=buffer
    

    UTM 参数为:

    utm_content=buffercf3b2&utm_medium=social&utm_source=facebook.com&utm_campaign=buffer
    

    在您的用例中:

    • 网址:

      https://www.marketbeat.com/stocks/NASDAQ/ALLO/?utm_source=404Redirect&utm_medium=404Redirect
      
    • UTM 参数:

      utm_source=404Redirect&utm_medium=404Redirect
      

    UTM 参数

    有五个 UTM 参数,它们可以按任意顺序使用:

    Parameter    Purpose                                                        Examples
    ---------    -------                                                        --------
    utm_source   Identifies which site sent the traffic.                        utm_source=Facebook
    utm_medium   Identifies what type of link was used.                         utm_medium=cpc
    utm_campaign Identifies a specific product promotion.                       utm_campaign=new_sale
    utm_term     Identifies search terms.                                       utm_term=treck+shoes
    utm_content  Identifies what was clicked to bring the user to the site.     utm_content=loginlink
    

    【讨论】:

      猜你喜欢
      • 2021-04-03
      • 1970-01-01
      • 2013-07-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-05-28
      • 2016-01-10
      • 2016-05-24
      相关资源
      最近更新 更多