【发布时间】:2015-02-27 22:53:34
【问题描述】:
导航 here 并搜索“下载所有馆藏”,您将到达 link 我要抓取的文件(标题和单元格内容)。
当我传入表格链接(而不是表格内容)时,使用 open-uri 或 Roo 返回页面源。
使用 Ruby,我如何读取这个文件的内容?理想情况下,我想提取内容并将原始文件保存为只读格式。
注意:我已经在使用 Mechanize/Nokogiri 进行抓取,并希望使用上述链接的 Excel 文件来补充/验证我的抓取。
【问题讨论】:
标签: ruby-on-rails ruby excel ruby-on-rails-4 roo-gem