【问题标题】:How do I get the pageid from a Wikipedia page?如何从 Wikipedia 页面获取 pageid?
【发布时间】:2015-03-17 16:22:13
【问题描述】:

在 Flask 应用程序中,或者更好的是仅使用 wikipedia API,我如何从 Wikipedia url 获取 pageid?

我的意思是从这个http://en.wikipedia.org/wiki/Stack_Overflow 到这个http://en.wikipedia.org/wiki?curid=21721040

我可以通过 API 沙箱解决此问题,但只能从标题搜索,而不是从单个 URL 搜索。

说的搜索示例: https://en.wikipedia.org/wiki/Special:ApiSandbox#action=query&prop=pageprops&format=json&ppprop=wikibase_item&titles=Stack%20Overflow

我能否以更直接的方式查询它,而无需借助维基百科搜索?我的意思是我已经知道人类可读的 url...

【问题讨论】:

  • 你在什么环境下工作?
  • 认为这是可以通过 API 实现的,所以忘了提及:我正在使用 Python/Flask,我正在相应地编辑问题和标签
  • 我只是想知道您是否会编写一个在该页面中运行的 JavaScript 用户脚本,在这种情况下您只需要访问一个变量而不是使用 API。

标签: python-2.7 flask wikipedia wikipedia-api pywikibot


【解决方案1】:

不,您不能在 API 中使用 URL,您需要使用页面名称或页面 ID 来识别文章。

请注意,您找到的 https://en.wikipedia.org/w/api.php?action=query&titles=Stack%20Overflow 不是“搜索”,它只是从标题中获取页面 ID 的查询。使用它。

【讨论】:

    猜你喜欢
    • 2015-07-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多