【发布时间】:2010-12-27 23:31:05
【问题描述】:
我正在尝试将 Wikipedia 信息框中的数据转换为哈希或其他内容,以便我可以在我的 Ruby on Rails 程序中使用它。具体来说,我对Infobox company 和Infobox person 很感兴趣。我一直在使用的例子是“福特汽车公司”。我想获取该公司的公司信息以及福特公司框中链接到的人员的人员信息。
我已经尝试通过Wikipedia API 或DBPedia 弄清楚如何做到这一点,但我运气不佳。我知道维基百科可以返回一些我可以用 ruby 解析的 json 内容,但我无法弄清楚如何获取信息框。对于 DBPedia,我什至不知道如何查询它以获取福特汽车公司的信息。
【问题讨论】:
标签: ruby web-scraping wikipedia dbpedia mediawiki-api