【发布时间】:2013-08-08 06:36:08
【问题描述】:
我正在使用 Pentaho Kettle 并正在考虑如何规范化我的平面文件 (csv) 数据。最终将其存储到数据库中。
csv 结构:商品名称、store1 销售数量、store2 销售数量、商店...
预期结果:商品名称、店铺名称、销售数量
感谢任何指导。
【问题讨论】:
标签: normalization transformation etl pentaho kettle
我正在使用 Pentaho Kettle 并正在考虑如何规范化我的平面文件 (csv) 数据。最终将其存储到数据库中。
csv 结构:商品名称、store1 销售数量、store2 销售数量、商店...
预期结果:商品名称、店铺名称、销售数量
感谢任何指导。
【问题讨论】:
标签: normalization transformation etl pentaho kettle
您可以使用Row Normalizer 步骤执行此操作,只要商店数量是固定的或至少有一个最大值。如果它是可变的,则必须使用 JavaScript 步骤或 UDJC。请参阅文档了解如何使用这些步骤:
如果它是可变的,我会考虑在加载之前对文件进行预处理。我已经用 Python 完成了这项工作,而且效果很好。
【讨论】: