【发布时间】:2017-08-28 03:25:26
【问题描述】:
如何在 apache beam(2.1.0) 中写入文本文件之前检查 pcollection 是否为空?
我在这里要做的是将文件分解为指定数量的 pcollections,作为通过 ValueProvider 提供给管道的参数。由于此 ValueProvider 在管道构建时不可用,我声明了一个不错的 26 号(字母总数,这是用户可以输入的最大数量),以使其可用于.withOuputTags()。所以我得到了 26 个元组标签,在写入文本文件之前我必须从中检索 pcollections。所以在这里,只有少数用户输入的标签会被填充,其余的都是空的。因此,在我应用 TextIO.write() 之前,我想忽略一些标签返回的空 pcollections。
【问题讨论】:
标签: google-cloud-dataflow apache-beam