【发布时间】:2014-03-12 17:45:12
【问题描述】:
我正在尝试从维基百科页面中提取内部链接。这是我正在使用的查询
/w/api.php?action=query&prop=links&format=xml&plnamespace=0&pllimit=max&titles=pageTitle
但是,结果并不反映 wiki 页面上的内容。以随机文章here 为例。此页面上只有十几个链接。但是,当我进行查询时,
/w/api.php?action=query&prop=links&format=xml&plnamespace=0&pllimit=max&titles=Von_Mises%E2%80%93Fisher_distribution
我收到了 187 个链接。我猜 API 可能有一个包含所有已添加到页面的链接的数据库,包括所有修订。是这样吗?如何仅从最新版本中获取链接?
【问题讨论】:
-
会不会是您忘记了导航框中的链接?从我可以看到来自 API 回复的所有链接都在页面中。你能举一个不应该存在的链接的例子吗?
-
+1。你是对的,狮子座。不幸的是,API 不允许我指定从页面的哪个部分提取链接:(
标签: mediawiki wikipedia wikipedia-api mediawiki-api