【问题标题】:how to normalize the records? e.g. several similar columns into rows如何规范化记录?例如几个相似的列成行
【发布时间】:2013-08-08 06:36:08
【问题描述】:

我正在使用 Pentaho Kettle 并正在考虑如何规范化我的平面文件 (csv) 数据。最终将其存储到数据库中。

csv 结构:商品名称、store1 销售数量、store2 销售数量、商店...

预期结果:商品名称、店铺名称、销售数量

感谢任何指导。

【问题讨论】:

    标签: normalization transformation etl pentaho kettle


    【解决方案1】:

    您可以使用Row Normalizer 步骤执行此操作,只要商店数量是固定的或至少有一个最大值。如果它是可变的,则必须使用 JavaScript 步骤或 UDJC。请参阅文档了解如何使用这些步骤:

    PDI Transform Steps

    如果它是可变的,我会考虑在加载之前对文件进行预处理。我已经用 Python 完成了这项工作,而且效果很好。

    【讨论】:

    • 使用 Row Normalizer 进行优化。谢谢。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-12-19
    • 1970-01-01
    • 2016-07-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-11-27
    相关资源
    最近更新 更多