【发布时间】:2009-11-12 01:23:59
【问题描述】:
不幸的是,我遇到了一个我似乎无法超越的问题,不幸的是,我也只是 Ruby on rails 的新手,因此问题的数量很多
我正在尝试抓取如下网页:
http://www.yellowpages.com.mt/Malta/Grocers-Mini-Markets-Retail-In-Malta-Gozo.aspx
我想抓取下一页的地址、电话和 URL,在这种情况下是
http://www.yellowpages.com.mt/Malta/Grocers-Mini-Markets-Retail-In-Malta-Gozo+Ismol.aspx
我一直在尝试任何我能想到的东西,但似乎没有任何效果,因为它们被设置为不可见左右。
地址在 h3 标记内,但它似乎不可废弃。我也一直在从以下网址http://www.rubyrailways.com/ajax-scraping-with-scrubyt-linkedin-google-analytics-yahoo-suggestions/ 研究 ScRUBYt,但我似乎真的找不到在这种情况下如何应用它们的正面或反面。
我非常感谢任何指点,因为这是我真正需要克服的障碍才能继续完成我的任务。提前感谢您的帮助。
【问题讨论】:
标签: html ruby-on-rails screen-scraping hpricot scrubyt