【问题标题】:Transformation configuration改造配置
【发布时间】:2012-06-04 09:16:56
【问题描述】:

什么是配置我的转换的最合适和最佳实践驱动的方式?

换句话说,假设我有一个基于kettle的大型ETL解决方案,它通过连接到不同的数据源来完成工作,我想将这些数据源存储在一个集中位置,并让每个转换在每次需要时都查找它连接到某个地方。

在 SSIS 中有包配置,我使用 pentaho 的替代方案是什么?

Ps:我不想安装任何 3rd 方框架。

谢谢

【问题讨论】:

    标签: etl pentaho kettle data-integration


    【解决方案1】:

    这可以通过多种方式完成。

    1. 参数化数据库连接,并通过kettle.properties 配置属性。您仍然可以从共享区域或其他地方访问该kettle.properties。

    2. 同上,但通过从数据库读取凭据来配置连接。必须手工制作,但需要注意一些事项。

    3. 如果您使用存储库,那么无论如何数据库连接都会集中存储。因此,如果您有一个 dev 和一个 prd repo,当您提升时,不要提升 db 连接本身。虽然比听起来更棘手。

    至于所有这些,新的 4.4(?) 版本应该具有适当的生命周期管理,以使处理所有这些事情变得更加容易!

    【讨论】:

    • 意思是我还没有这个开箱即用,太糟糕了。谢谢
    • 别让你失望,Kettle 非常强大,我当然发现它是一个非常有价值的工具。
    • 我完全没有离开 :) 只是很想有一些开箱即用的东西,因为它就像一个标准的东西;动态配置.. :) thx
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-10
    • 2016-12-13
    • 2019-09-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多