【问题标题】:Get Wikidata sitelinks counts for all items with at least one sitelink获取包含至少一个附加链接的所有项目的 Wikidata 附加链接计数
【发布时间】:2022-06-11 17:53:44
【问题描述】:

有没有一种简单的方法来获取所有 Wikidata 项目的附加链接计数数据?我想使用这些数据来帮助对可能的文本实体链接到 Wikidata 项进行排名

我真的只对至少有一个的项目的计数感兴趣(例如,wikibase:sitelinks 值 >0)。根据我看到的统计数据,只有大约 1/3 的 Wikidata 项目至少有一个附加链接。

我不确定 wikibase:sitelinks 是否包含在标准的 WIkidata 转储中。我可以尝试使用 OFFSET 和 LIMIT 的 SPARQL 查询,但我怀疑该方法能否完成。

【问题讨论】:

    标签: wikidata


    【解决方案1】:

    查询示例:“Wikidata 中具有最多附加链接的猫”:

    # select all Cats, ordered by most Wikimedia sitelinks (with count and the raw sitelinks)
    SELECT ?item
           ?itemLabel
           ( COUNT( ?sitelink ) AS ?sitelink_count )
           ( GROUP_CONCAT( ?sitelink ) AS $sitelinks_raw )
    WHERE {
      ?item wdt:P31 wd:Q146.        # it's a Cat
      ?sitelink schema:about ?item. # sitelink about the item
                                    # label in my language, or English
      SERVICE wikibase:label {
         bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en".
      }
    }
    GROUP BY ?item ?itemLabel
    HAVING ( COUNT( ?sitelink ) > 3 )
    ORDER BY DESC( COUNT( ?sitelink ) )
    

    Try query on Wikidata

    你觉得这很有趣吗?

    如果你愿意,维基数据有更多关于在 SPARQL 中查询附加链接的好例子:

    https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries#Working_with_sitelinks

    【讨论】:

      猜你喜欢
      • 2015-04-16
      • 1970-01-01
      • 2021-11-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-10-10
      相关资源
      最近更新 更多