【问题标题】:Retrieve information from a mediawiki in a more structured way以更结构化的方式从 mediawiki 检索信息
【发布时间】:2015-09-01 16:12:58
【问题描述】:

我们希望使用自托管的 mediawiki 作为轻量级 CMS 来检索信息。但是,基本 REST API 在检索内容的方式上非常有限:这可能是因为 wiki 上的大多数信息都是非结构化形式。

  • 是否可以将您自己的 ID 系统添加到 mediawiki,这样您就可以搜索特定的 ID(或者甚至以类似 REST 的方式通过 ID 请求内容,而不是获取整个页面或部分的信息)?例如/:heading/:subheading/:sub-subheading ?
  • 或者如果没有,至少有一种方法可以添加您自己的 ID,以便您可以以更结构化的方式解析部分中的信息?

【问题讨论】:

  • 我建议您查看 Semantic MediaWiki
  • 嗯,我完全支持语义网,但这个 wiki 确实仅供私人公司使用 :( 数据可以转换为语义数据,但这是一个独立的项目。我只需要能够使 mediawiki 更有条理...自定义 ID/标签、API 扩展等。
  • 这就是 Semantic MediaWiki 的用途——让您的数据更加结构化。澄清一下:Semantic MediaWiki 与“语义网”的语义 html 标记(几乎)没有任何关系。它只是一个扩展,可让您在 wiki 中存储结构化数据,使其行为有点像协作图形数据库。
  • 啊,是的,我的意思是,我想将当前的 mediawiki 数据转换为类似图形的数据库结构需要相当长的时间?如果我们事先选择语义媒体维基,那就没有必要了……

标签: rest content-management-system mediawiki mediawiki-api mediawiki-extensions


【解决方案1】:

通过使用解决: - 默认 REST API,使用 npm 包 nodemw 进行简化。 - 使用 npm 包 instaview 将 wiki/文本解析为 HTML。 - 使用 npm 包 Cheerio 访问/修改 HTML 服务器端。

免费、非结构化的 BLOB 文本万岁!去维基媒体去!天哪。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-08-28
    • 1970-01-01
    • 2012-03-24
    • 2012-06-05
    • 1970-01-01
    • 2017-12-17
    • 1970-01-01
    相关资源
    最近更新 更多