【发布时间】:2011-12-30 22:32:47
【问题描述】:
我有一个非常幼稚的问题,我找不到答案。 我有一个 wordpress 博客。 所有帖子都列在几个页面中,例如
mydomain.com/blog/
mydomain.com/blog/page/2/
...
mydomain.com/blog/page/N/
所以我不希望爬虫“记住”特定页面上的内容,但想让它 抓取每个“/page/”上链接的所有帖子,它是否能够跟踪和抓取我不允许的页面上的链接
disallow: /blog/page/ ?
或者我如何禁止抓取特定页面上的帖子,但仍然让它抓取所有帖子?
【问题讨论】:
标签: wordpress robots.txt web-crawler