【问题标题】:Getting all properties from wikipedia infobox (java) [duplicate]从维基百科信息框(java)获取所有属性[重复]
【发布时间】:2011-12-07 18:07:13
【问题描述】:

我希望从 Wikipedia 页面(仅包含信息框的页面)中获取所有信息框属性和值。 使用简单的 WebRequest 解析信息框会给我太多的垃圾。因此,我考虑使用 dbpedia 并使用 Jena (SPARQL) 获取数据。 我怎样才能做到这一点?是否有一个简单的查询可以将所有属性作为键值对提供给我?或RDF,然后将其转换为我需要的。

【问题讨论】:

    标签: java wikipedia sparql jena dbpedia


    【解决方案1】:

    http://dbpedia.org/sparql 有一个连接到 dbpedia 的公共 SPARQL 端点,您可以使用它来 实验。在http://wiki.dbpedia.org/OnlineAccess 中描述了用于构建查询的示例和各种其他工具。您还可以下载数据集以在本地尝试查询。

    澄清一下,RDF 是 dbpedia 发布的数据格式。SPARQL 是查询 RDF 的查询语言。 Jena 是一个包含 RDF 数据存储和 SPARQL 引擎的特定实现。

    【讨论】:

    • 投反对票的人愿意发表评论吗?如果您发现问题,很乐意改进答案。
    【解决方案2】:

    尝试使用来自http://wiki.dbpedia.org/Downloads37 的转储。 例如“原始信息框属性”。

    【讨论】:

      猜你喜欢
      • 2020-02-02
      • 2020-07-27
      • 1970-01-01
      • 2016-07-27
      • 2016-02-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多