【问题标题】:Copy chosen Wikipedia articles into own wiki?将选定的 Wikipedia 文章复制到自己的 wiki 中?
【发布时间】:2009-05-26 03:31:11
【问题描述】:

有没有办法将某些维基百科文章(大约 10,000 篇)批量复制到我自己的 mediawiki 网站?

编辑: 如何在不覆盖类似名称的文章/页面的情况下执行此操作? 我也不打算使用非法手段(爬虫等)

【问题讨论】:

    标签: php mysql mediawiki wikipedia


    【解决方案1】:

    如果您希望获得一组特定的文章,那么您可以使用导出页面 (http://en.wikipedia.org/wiki/Special:Export) 来获得相关页面的 XML 转储;您可以一次导出多个页面,但您可能希望分隔您的请求。

    您可以使用Special:Importmaintenance/ 中的导入脚本之一将XML 转储导入MediaWiki。

    【讨论】:

    • 这包括图片吗?如果没有,是否也有自动获取图像的方法?
    • 它不包含图像,因为它是页面信息、修订元数据和文本的直接 XML 转储,并且格式尚未扩展为包含二进制图像数据。严格来说,这是一个技术限制。理论上,您可以导入侵犯版权的文本,而软件不会阻止这一点。
    【解决方案2】:

    维基百科数据库可用于download

    【讨论】:

      【解决方案3】:

      【讨论】:

      • 因此,在提供指向外部站点的链接时,通常最好至少提供内容的高级摘要,以防外部链接更改或被删除。未来的 SO 访问者仍然有一些东西可以使用。
      猜你喜欢
      • 1970-01-01
      • 2018-03-20
      • 2010-10-11
      • 2017-01-28
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-07-31
      • 2011-06-17
      相关资源
      最近更新 更多