【问题标题】:Modify Google Webmaster Robots.txt Code to disallow urls修改 Google Webmaster Robots.txt 代码以禁止 url
【发布时间】:2021-07-09 05:03:23
【问题描述】:

我在 ahrefs.com 上遇到一些 hreflang 和重定向错误,因为 utm 活动和弹出链接的锚点设置为“#”或“#!”。我想在我的 robots.txt 文件中添加一些代码,以防止 google 抓取这些 url,从而使这些错误消失。

例如,我想禁止抓取的网址是:

https://mywebsite.com/#
https://mywebsite.com/#!
https://mywebsite.com/about?utm_campaign=something

我尝试了这段代码,但它不起作用:

不允许:/*#!

禁止:/*utm_campaign

【问题讨论】:

    标签: wordpress google-analytics web-crawler google-search-console google-api-webmasters


    【解决方案1】:

    Hash(#) 是 robots.txt 中的注释符号。在 robots.txt 中 # 之后的所有内容都将被忽略

    此外,浏览器和爬虫永远不会将 URL 中 # 之后的部分发送到服务器,因此禁止它是没有意义的。

    【讨论】:

      猜你喜欢
      • 2011-04-07
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-06-11
      • 2016-09-13
      相关资源
      最近更新 更多