【发布时间】:2015-01-27 14:45:54
【问题描述】:
我正在为我们 DNN 网站上的博客、新闻文章等使用 EasyDNN 新闻模块。核心 DNN 站点地图不包括该模块生成的文章,但该模块会创建自己的站点地图。
例如: domain.com/blog/mid/1005/ctl/sitemap
当我尝试将此站点地图提交给 Google 时,它说我的 Robots.txt 文件阻止了它。
查看 DNN 附带的 Robots.txt 文件,我注意到 Slurp 和 Googlebot 用户代理下的以下行:
Disallow: /*/ctl/ # Slurp permits *
Disallow: /*/ctl/ # Googlebot permits *
我想提交模块的站点地图,但我想知道为什么这些用户代理不允许使用 /ctl,如果我只是从文件中删除这些行会有什么影响?具体来说,它与 Google 抓取网站有关。
作为补充参考,我已阅读下面有关通过禁止包含 /ctl 的特定网址(例如登录、注册、条款等)来避免重复内容处罚的文章。我想知道这是否是 DNN 刚刚禁止任何内容的原因带有 /ctl 的网址。
http://www.codeproject.com/Articles/18151/DotNetNuke-Search-Engine-Optimization-Part-Remov
【问题讨论】:
标签: seo dotnetnuke robots.txt googlebot