【发布时间】:2019-04-27 22:28:25
【问题描述】:
我编写了简单的程序来读取 CSV(电子邮件)并在数据存储中查找关联的 id。这也会搜索 AES 加密电子邮件。
使用 Eclipse 从directrunner 运行良好,但为了获得数据流中的流程图,我使用了dataflowruuner。这启用了执行图,但即使有 3 条记录,它的运行正弦曲线也超过 30 分钟。为什么?
使用 - DataflowPipelineOptions options = PipelineOptionsFactory.as(DataflowPipelineOptions.class);
而不是
PipelineOptions options = PipelineOptionsFactory.fromArgs(option).withValidation().create();
【问题讨论】:
标签: google-cloud-dataflow pipeline apache-beam dataflow