作用

网站告诉爬虫哪些可以爬取,哪些不能爬取。
https://www.jd.com/robots.txt
User-agent: 对于任意的网络爬虫来源,它定义为User-agent
Disallow: ?
任何爬虫哪个都不允许访问以问号开头的文件
*代表所有/代表目录
Robots协议
Robots协议
Robots协议

相关文章:

  • 2022-12-23
  • 2021-09-01
  • 2021-11-20
  • 2022-12-23
  • 2022-12-23
  • 2021-07-09
  • 2021-08-31
  • 2021-05-05
猜你喜欢
  • 2021-11-25
  • 2021-08-28
  • 2022-12-23
  • 2021-11-28
  • 2021-09-03
相关资源
相似解决方案