【发布时间】:2018-11-22 07:36:40
【问题描述】:
我正在尝试使用 NiFi 加入多个表。数据源可能是 MySQL 或 RedShift,也可能是未来的其他东西。目前,我为此使用 ExecuteSQL 处理器,但输出位于单个流文件中。因此,对于 TB 的数据,这可能不合适。我也尝试过使用 generateTableFetch 但这没有加入选项。
这是我的问题:
- ExecuteSQL 处理器有什么替代品吗?
- 有没有办法让 ExecuteSQL 处理器在多个流文件中输出?目前我可以使用 SplitAvro 处理器拆分 ExecuteSQL 的输出。但我希望 ExecuteSQL 本身拆分输出
-
GenerateTableFetch 根据偏移量生成 SQL 查询。当数据集变大时,这会减慢处理速度吗?
请分享您的想法。提前致谢
【问题讨论】:
标签: apache-nifi