【发布时间】:2014-08-23 17:22:23
【问题描述】:
我正在研究网站抓取。
我想问以下问题。
如果某个网站出现在谷歌搜索结果中,我可以抓取该网站吗?
-
在一个网站的robots.txt中,写着如下。如何通过浏览器确认本网站禁止抓取的网页?
Disallow: /usr/top
你能告诉我以上问题的答案吗?
【问题讨论】:
-
你能改写你的第二个问题吗?我不明白。 -- 如果它是一个单独的问题,您可能应该为其创建一个新问题。
-
对不起。我编辑第二个问题。你能理解吗?
-
您想要一种方法来轻松查看当前网页(在浏览器中打开)是否在 robots.txt 中被阻止?或者您想确认没有机器人抓取它?或者你想知道这个
Disallow是什么意思吗?还是……? -
我想知道 /usr/top 中指明的具体网页 URL。