【问题标题】:Pentaho / crossing filesPentaho/交叉文件
【发布时间】:2013-10-08 01:58:13
【问题描述】:

我试图跨越 2 个不同的 .csv 文件,以便在输出文件中生成一个指示新的、更改的、删除的和相同的条目的输出文件。 我试图按照这里的解释做 http://wiki.pentaho.com/display/EAI/Merge+rows 我使用合并行(差异)来尝试实现这一点,但无论我尝试什么它都不起作用,因为关键字段我只使用不更新的行的值,即 ID。 我试图做的是为两个输入使用相同的文件,当我不更改任何内容时,所有行的标志字段值都是“相同的”,但是如果我尝试修改一个文件中的一个行中的一个单个值,我变了?也许3或4个相同?任何想法为什么会这样?我就是想不通,先谢谢了。

【问题讨论】:

  • 您是否对输入进行了排序?这通常是问题的根源。您必须将两个输入流排序到 Merge Rows (Diff) 步骤,并且以相同的顺序、相同的大小写敏感度等进行。
  • 我不是,我现在尝试使用“排序行”,但在合并过程中出现错误;(imageshack.us/photo/my-images/268/r2lh.png
  • 确保您按完全相同的键排序,升序/降序必须匹配并且区分大小写必须匹配。还要确保您在 Merge Rows (Diff) 步骤中使用的键与您正在排序的键完全匹配。
  • 预览或运行时是否出现合并错误?如果 preview 然后运行转换,您将获得更好的堆栈跟踪。

标签: csv pentaho kettle


【解决方案1】:

Merge rows diff 是这里的正确答案。

如果您在 diff 之后使用目标数据库,那么您可以将其与“合并后同步”配对,但在这种情况下,文本文件输出将执行此操作。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-08-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-04-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多