一、爬虫的分类

  • **通用爬虫:**通常是指搜索引擎的爬虫
  • **聚焦爬虫:**针对特定网站的爬虫

二、通用搜索引擎和聚焦爬虫工作的原理

从零开始学爬虫(5)——爬虫的流程
其中从相应内容中再次提取URL指的是有些网站例如新浪网站中,新闻分了很多页,我们要从返回的页面中提取“下一页”等等的URL

相关文章: