【问题标题】:determine the type of name using mediawiki?使用 mediawiki 确定名称的类型?
【发布时间】:2010-07-20 18:50:35
【问题描述】:

如果这篇文章是关于 Lebron_James,那么我会知道它是关于一名运动员的。

【问题讨论】:

  • 它是如何神奇地做到这一点的?你可以使用类别,也许
  • 如果是Thomas_Jefferson,它会以无可挑剔的精度检测到它是开曼政治家:en.wikipedia.org/wiki/…
  • 但是说真的:你问的是查询维基百科的方法吗?
  • @Pekka,如果您已经准备好文章链接。你将如何确定这一点?
  • @tomxu 这并不容易,因为维基百科没有像“运动员”这样的单一分类。您最好的选择可能是使用 SimpleHTMLDom 之类的东西解析页脚中的“类别”链接,并尝试获取与您相关的类别。

标签: wiki mediawiki data-mining dbpedia data-extraction


【解决方案1】:

类别很有用,但infoboxes 更好。那么问题就变成了如何利用信息框中的信息?

看看DBpedia 的魔力。您必须先阅读大量内容,然后才能使用它,然后 SPARQL 也有很长的学习曲线:

SELECT ?property ?hasValue ?isValueOf
WHERE {
  { <http://dbpedia.org/resource/LeBron_James> ?property ?hasValue }
  UNION
  { ?isValueOf ?property <http://dbpedia.org/resource/LeBron_James> }
}

Stackoverflow 不喜欢这个 URL,但它有大量有用的信息供您处理:

http://dbpedia.org/snorql/?query=SELECT+%3Fproperty+%3FhasValue+%3FisValueOf%0D%0AWHERE+{%0D%0A++{+%3Chttp://dbpedia.org/resource/LeBron_James%3E+%3Fproperty+%3FhasValue+}%0D%0A++UNION%0D%0A++{+%3FisValueOf+%3Fproperty+% 3Chttp://dbpedia.org/resource/LeBron_James%3E+}%0D%0A}

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-10-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多