【发布时间】:2017-08-07 16:14:44
【问题描述】:
我有一个维基百科文章的数据转储,仅按其 pageid 列出,我希望按名称空间过滤它们。编写一些python(可能使用请求模块)来调用MediaWiki Query API,使用pageids参数一次查询50个命名空间会相对容易。
但是,我打算改用 Pywikibot,因为查询 API 的最佳实践和错误处理可能已融入 Pywikibot,如果我犯了逻辑错误和过度查询,我的 IP 被禁止的可能性就较小API。 (此外,我希望为我未来的机器人写作努力获得这个模块的经验)
但是,我真的找不到很好的 Pywikibot 文档,并且在现有文档中找到有关此 API 的语言时遇到了麻烦。我还尝试了其他各种 python 包,希望找到与此 API 的绑定(绑定的正确用法吗?),但无济于事。
【问题讨论】:
-
无法通过pageid实例化pywikibot中的页面,所以我认为你最好使用查询api。
标签: python mediawiki wikipedia-api mediawiki-api pywikibot