【发布时间】:2011-06-26 06:24:01
【问题描述】:
我正在考虑自己编写,但我想知道是否有任何用 Ruby 编写的优秀网络爬虫。
没有成熟的网络爬虫,任何可能有助于构建网络爬虫的 gem 都会很有用。我知道这部分问题在几个地方都涉及到了,但是适用于构建网络爬虫的 gems 列表也是一个很好的资源。
【问题讨论】:
-
如果你想自己写一个爬虫,你可以从hpricot.com开始。 (尝试使用
a标签)。 -
这里的重要问题是:使用 Javascript 还是不使用 Javascript?
-
@Radek - 不要使用 Hpricot,使用 Nokogiri。
标签: ruby web-crawler