【发布时间】:2011-04-16 19:13:28
【问题描述】:
我目前正在通过我的 rails 应用程序解析 twitter 提要,并想知道如何跟踪推文中的链接并抓取外部内容(例如,如果推文包含指向 TechCrunch 上一篇文章的链接,请遵循链接到文章并抓取文章的标题和正文内容)。 iPad 版 Flipboard 就是一个很好的例子。
我熟悉使用 Nokogirl / Mechanize 进行屏幕抓取,但试图弄清楚如何以一种无论推文中的链接链接到何处(无论是 TechCrunch 还是 Flickr等...)。
任何想法/见解将不胜感激!
【问题讨论】:
标签: ruby-on-rails ruby ruby-on-rails-3 rubygems