【发布时间】:2021-11-09 11:37:26
【问题描述】:
【问题讨论】:
-
robots.txt 文件可能会有所帮助 - 它被放置在根目录中。但是,它并不能阻止恶意爬虫寻找东西。参见例如stackoverflow.com/questions/9102914/… 对此进行一些讨论。
-
请提供足够的代码,以便其他人更好地理解或重现问题。
标签: c# html jquery css asp.net
【问题讨论】:
标签: c# html jquery css asp.net
如果您不想抓取,请使用 robots.txt 禁止文件。 喜欢
User-agent: *
Allow: /User-agent: *
Allow: /
Disallow: /owa/
允许路径不允许禁止路径。用户代理是试图抓取的搜索引擎。
只需在您的根目录上创建 robots.txt
您可以确保将 doc 文件夹置于 disallow like 中
User-agent: *
Allow: /User-agent: *
Allow: /
Disallow: /docs/
用文档的地址文件夹更改文档。
【讨论】:
description 和 keyword 与此无关。请删除,它看起来像垃圾邮件...
User-agent: * Allow: /User-agent: * Allow: / Disallow: /docs/ 在 robots.txt 中?