【发布时间】:2018-09-14 20:09:05
【问题描述】:
由于文档仅适用于 JAVA,我无法真正理解它的含义。
它声明 - “虽然 ParDo 总是产生一个主输出 PCollection(作为 apply 的返回值),但您也可以让 ParDo 产生任意数量的附加输出 PCollection。如果您选择有多个输出,您的ParDo 将返回捆绑在一起的所有输出 PCollection(包括主输出)。例如,在 Java 中,输出 PCollection 捆绑在类型安全的 PCollectionTuple 中。"
我了解捆绑在一起的含义,但是如果我在我的 DoFn 中生成一个标签,它是否会在所有其他输出为空的情况下生成一个捆绑包,并在代码中遇到它们时生成其他输出?还是等待所有收益都准备好输入,然后将它们一起输出?
在文档中没有很清楚的说明。虽然我认为它不会等待,遇到时只会屈服,但我仍然需要了解发生了什么。
【问题讨论】:
标签: google-cloud-dataflow apache-beam