【发布时间】:2013-10-08 01:58:13
【问题描述】:
我试图跨越 2 个不同的 .csv 文件,以便在输出文件中生成一个指示新的、更改的、删除的和相同的条目的输出文件。 我试图按照这里的解释做 http://wiki.pentaho.com/display/EAI/Merge+rows 我使用合并行(差异)来尝试实现这一点,但无论我尝试什么它都不起作用,因为关键字段我只使用不更新的行的值,即 ID。 我试图做的是为两个输入使用相同的文件,当我不更改任何内容时,所有行的标志字段值都是“相同的”,但是如果我尝试修改一个文件中的一个行中的一个单个值,我变了?也许3或4个相同?任何想法为什么会这样?我就是想不通,先谢谢了。
【问题讨论】:
-
您是否对输入进行了排序?这通常是问题的根源。您必须将两个输入流排序到 Merge Rows (Diff) 步骤,并且以相同的顺序、相同的大小写敏感度等进行。
-
我不是,我现在尝试使用“排序行”,但在合并过程中出现错误;(imageshack.us/photo/my-images/268/r2lh.png
-
确保您按完全相同的键排序,升序/降序必须匹配并且区分大小写必须匹配。还要确保您在 Merge Rows (Diff) 步骤中使用的键与您正在排序的键完全匹配。
-
预览或运行时是否出现合并错误?如果 preview 然后运行转换,您将获得更好的堆栈跟踪。