【发布时间】:2017-11-21 22:55:57
【问题描述】:
我们需要创建单独的线程来读取多个文件。
- 线程 1 可以读取文件 1 并创建
PCollection<String>。我可以在多线程环境中执行Pardo Operation。并从PCollection< String >创建一个PCollection < String,String >? - 线程 2 并从线程 1 完成相同的操作,但在不同的文件 File 2 上。
- 在线程 1 和线程 2 操作完成后,在主线程中加入 File1 和 File 2 的输出。
能否请您告诉这是否可行,这是一种推荐的方法?
【问题讨论】:
标签: apache-beam