【发布时间】:2017-10-19 15:51:10
【问题描述】:
最初我们有五个表要处理,因此我们为 5 个表创建了 fork,如下所示。但现在我们需要并行处理 125 个表。如果我分叉所有 125 个表,workflow.xml 会变得更大并且无法维护。如何配置工作流以并行处理所有 125 个表。
<start to="fork-966"/>
<fork name="fork-966">
<path start="table1_sqoop" />
<path start="table2_sqoop" />
<path start="table3_sqoop" />
<path start="table4_sqoop" />
<path start="table5_sqoop" />
</fork>
帮助表示赞赏。
【问题讨论】:
标签: hadoop oozie cloudera-cdh