【问题标题】:How to publish tables from SQL database as datasets automatically into CKAN如何将 SQL 数据库中的表作为数据集自动发布到 CKAN
【发布时间】:2017-02-16 19:16:45
【问题描述】:

我正在为大学学生实施开放数据门户,以便他们可以访问在大学不同建筑物中生成的所有数据集,并且他们可以处理这些数据以开发有趣的应用程序。

我已经安装了 CKAN。它工作正常。我也实现了收割机。

我主要关心的是: 大学有系统存储来自不同传感器的数据,如温度、光、噪声等。 该项目的目的是将系统存储的数据连接到ckan,以便在系统存储的数据和开放数据平台之间进行数据同步。我尝试收集几种来源类型。

您能否指导我什么是可以帮助我连接到大学数据存储系统的最佳功能。

uni 是否需要设置 web 服务器,我们可以通过 CKAN 收获连接 CKAN?

我们是否需要实现一个像 publicopendataeu 使用的新扩展(例如 opengov_se 等)来连接到不同的资源,或者我们可以使用现有的扩展?

您推荐 uni 以什么格式存储他们的数据? 目前数据存储为 SQL 数据库。

有什么方法可以将这些 SQL 表连接到 Ckan 并将这些表作为数据集导入?

【问题讨论】:

    标签: ckan


    【解决方案1】:

    一些建议:

    • 试试this CKAN extension。这个想法是允许查看远程 SQL 表。上次我尝试它时没有成功,但它似乎是最近更新的,并声称与 CKAN 2.5 兼容。
    • 使用 Datastore and Datastore API 让底层传感器/数据源直接写入 CKAN
    • 让当前系统直接写入 CKAN 数据存储表(即忽略 API)。不太好,但如果您已经为数据库写入设置了所有内容,那么工作量可能会减少。您需要先创建初始 CKAN 数据集和资源(每个资源 1 个 SQL 表)
    • (与上面类似)在数据库表之间创建一些优雅的镜像/复制系统。如果两个数据库都是 Postgres,也许只有可能/直截了当。
    • Harvesting 可以工作,但您必须编写自己的 Harvester 来查询/执行从数据库导出并将其导入/更新到 CKAN 资源中
    • (与上述类似)独立脚本,用于查询/执行从数据库导出并使用 CKAN/CKAN 数据存储 API 将其导入/更新到 CKAN 资源中

    【讨论】:

    • 非常感谢。这很有帮助。我同步了两个数据库,并且随着更改反映在 ckan 数据库中的表中,关联的表被刷新。
    • 这值得在 CKAN.org 上发表一篇博文!
    • @TanyaArora 我想知道你是如何实现同步的? CKAN数据库中的表中是否存在可用于远程写入关联表的触发器?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-02-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-06-05
    • 2021-04-03
    • 1970-01-01
    相关资源
    最近更新 更多