【问题标题】:Retrieving pageid from Wikipedia parse request从 Wikipedia 解析请求中检索 pageid
【发布时间】:2014-08-31 19:37:23
【问题描述】:

我正在使用 parse 模块从 Wikipedia api 检索文章内容:

"http://en.wikipedia.org/w/api.php?action=parse&format=json&page=[...]&callback=JSON_CALLBACK";

我得到的是一个对象,其中包含(在其他属性中)所请求页面的 html 内容。我还想要的是请求页面的 pageid。不幸的是,这不包括在内,除了使用query 模块发出第二个请求之外,我找不到其他方法来获取它。

使用parse模块请求文章时是否可以获取pageid?

【问题讨论】:

    标签: javascript mediawiki wikipedia wikipedia-api mediawiki-api


    【解决方案1】:

    使用parse模块请求文章时是否可以获取pageid?

    我不这么认为。通常你知道你感兴趣的页面的 id/title 标识符。但是你会得到被解析的修订的 id。

    我得到的是一个对象,上面有请求页面的 html 内容。

    如果这是您唯一感兴趣的事情,只需使用查询 api! revision module 也会为您提供解析后的内容:

    http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvparse=1&titles=[…]&format=json&callback=JSON_CALLBACK
    

    【讨论】:

    • 我明白了!是的,action=query&rvparse=1&rvprop=content 似乎也可以。虽然需要很长时间才能解析......但非常感谢您的提示!
    猜你喜欢
    • 2013-04-22
    • 2015-07-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-04-21
    • 2018-12-04
    • 2015-04-29
    相关资源
    最近更新 更多