【问题标题】:Yago ontology for entity disambiguation用于实体消歧的 Yago 本体
【发布时间】:2014-11-18 10:25:15
【问题描述】:

我在我的 SPARQL 查询中使用与 dbpedia-owl:Organisation 相同的 rdfs:type 来选择(显然)组织:

 SELECT ?s
 WHERE {
     ?s a dbpedia-owl:Organisation .
 } LIMIT 10

我想考虑使用 YAGO 本体来提高我在获取真实组织方面的表现。例如,FBI (http://dbpedia.org/resource/Federal_Bureau_of_Investigation) 不被视为 dbpedia-owl:Organisation,而是被标记为 yago:Organization108008335。

请注意班级名称末尾的“随机”(至少对我而言)数字。有谁知道这个数字代表什么?我怎么知道它是先验的?

此外,当我寻找更多具有这种格式的类时(使用下面的查询),我可以找到另外两个类:http://dbpedia.org/class/yago/Organization108008335http://dbpedia.org/class/yago/Organization101008378http://dbpedia.org/class/yago/Organization101136519

SELECT DISTINCT ?t WHERE {
    ?s a ?t
    FILTER(regex(str(?t), "http://dbpedia.org/class/yago/Organization\\d+"))
}

它们有什么不同吗?为什么不都是“yago:Organization”。随着新版本的 YAGO 本体可用,我是否应该期待“新的”组织类?在选择组织时,我还应该考虑其他什么课程?

【问题讨论】:

    标签: semantics ontology dbpedia virtuoso linked-data


    【解决方案1】:

    我最近一直在研究这个,所以我会尝试一一回答你所有的问题:

    请注意班级名称末尾的“随机”(至少对我而言)数字。有谁知道这个数字代表什么?我怎么知道它是先验的?

    该数字对应于 Wordnet 中单词的synset id。例如,如果您在wordnet 中查找 wordnet_organization_101136519(dbpedia 中的 URI 目前无法解析,可能他们在上一个版本中更改了某些内容),您会看到它的 synsetID 为“101136519”。我认为如果不查看 wordnet,您无法先验地知道它。

    它们有什么不同吗?为什么不都是“yago:Organization”。

    它们是不同的,因为它们在 wordnet 中有不同的定义。例如:

    wordnet_organization_101136519:“适当或有条不紊地分配或处置人员或事物的活动或结果‘他的劳动力组织非常有效’”。实例示例:Bogo-Indian_Defence。查看更多详情here

    wordnet_organization_101008378:“组织业务或与业务相关的活动的行为'他被带入监督新部门的组织'”。实例示例:Adam_Smith_Foundation。查看更多详情here

    如果您点击我提供的链接,您可以看到更多不同之处和共同点。

    随着新版本的 YAGO 本体的推出,我是否应该期待“新的”组织类?

    当他们生成 Yago 时,他们将 wordnet 中的每个单词都关联到一个 URI。如果添加更多关于组织的词,那么我想你会有更多的定义。但是不可能事先知道。

    在选择组织时我还应该考虑其他什么职业吗?

    您可以在 wordnet 中查找所有带有“组织”标签的类,然后将选项添加到您的查询中(或为每个类发出一个查询,以检索您感兴趣的不同组织)。 These are the classes with the "organization" label in Wordnet.

    希望对你有帮助。

    【讨论】:

      猜你喜欢
      • 2015-08-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-07-24
      • 1970-01-01
      相关资源
      最近更新 更多