NCrawler是一款国外的开源网络爬虫软件,遵循LGPL许可协议。其HTML处理使用的是htmlagilitypack开源库,采用xpath的方式处理定位网页元素,十分方便。同时其采用HttpWebRequest异步的方式获取网页,采集效率较高。台湾微软MSDN有一篇如何使用NCrawler参考文章。

官方地址:http://ncrawler.codeplex.com/

相关文章:

  • 2021-11-16
  • 2021-07-13
  • 2022-12-23
  • 2021-08-21
  • 2021-04-02
  • 2021-10-25
  • 2021-11-17
  • 2021-06-16
猜你喜欢
  • 2022-02-27
  • 2022-12-23
  • 2022-02-26
  • 2022-12-23
  • 2021-11-12
  • 2021-06-03
  • 2021-09-14
相关资源
相似解决方案