【发布时间】:2016-10-27 13:40:41
【问题描述】:
现在很清楚,转换的所有步骤都是并行执行的,在 Pentaho 中无法更改此行为。
鉴于此,我们有一个带有切换任务的场景,它检查特定字段(从文件名读取)并决定哪个任务(映射 - 子转换)将处理该文件。这是通用逻辑的一部分,在每个映射任务之前和之后,都会执行一些样板任务,例如更新数据库记录、发送电子邮件等。
问题是:如果我们没有“ACCC014”文件,则无法执行此转换。我知道这是不可能的,因为所有任务都是并行执行的,所以出现了第二个问题:在一些映射中,创建了 XML 文件。而且即使 Pentaho 使用空数据执行这个任务,我们也找不到避免创建 XML 输出文件的方法。
我们考虑过将这个开关逻辑移到作业中,因为理论上它是串行的,但没有发现可以进行这种区分的条件步骤。
我们还研究了元数据注入任务,但我们不认为这是要走的路。每个子转换都做了不同的工作。其中一些更新一些表,另一些写入文件,另一些在不同数据库之间移动数据。它们都接收一些文件作为输入并返回一个 send_email 标志和一个消息字符串。没有别的了。
有没有办法做我们愿意做的事?还是没有办法重用基于默认输入/输出的部分逻辑?
编辑:添加 ACCC014 转换。是的,“开始时不创建文件”选项被选中。
【问题讨论】:
-
这些 xml 文件是由 XML 输出步骤创建的吗?回到 5.2,XML 输出步骤在“文件”选项卡上具有“开始时不创建文件”选项。你检查了吗?
-
如果没有文件,为什么需要执行 ACCC014 转换?如果它有你想要的副作用,请将它们分解到另一个转换中。
-
@user4637357 是的,例如,通过 ACCC014 转换创建了一个 XML 文件。我检查了“不要在开始时创建文件”,但问题是无论如何都会执行转换,即使切换任务没有发送给它的记录。
-
@Brian.D.Myers 我不需要,实际上,这是我现在的问题。 switch 任务没有向 ACCC014 任务发送任何记录,但它仍然由 Pentaho 执行。我不知道,直到切换任务,我是否需要执行 ACCC014。我在这里失去什么了吗?
-
不,所有任务无论是否获取数据都会启动。是它创建不需要的文件的问题吗?您是否尝试设置“开始时不创建文件”选项?如果这些都不是问题,您能否发布由“ACCC014”运行的转换。
标签: pentaho kettle pdi pentaho-spoon pentaho-data-integration