【发布时间】:2015-07-09 18:47:35
【问题描述】:
我正在创建一个从 CSV 文件获取输入并输出到表的转换。那运行正确,但问题是我是否多次运行该转换。然后输出表一次又一次地包含重复的行。
现在我想从输出表中删除所有重复的行。
如果我反复运行转换,它不会影响输出表,直到它没有新行。
我该如何解决这个问题?
【问题讨论】:
-
您使用什么步骤将数据存储到表中?是
Table Output一步吗? -
@mzy 是表输出。
-
是否有标识每一行的键?或者你如何识别重复的行?
-
该数据中没有键。我们只能比较每一列
-
这意味着您需要比较表中的所有列才能找出重复的行?好的。我会发布一些解决方案..
标签: pentaho kettle pentaho-design-studio