【发布时间】:2018-09-06 03:17:05
【问题描述】:
在我们的项目中,我们将数据从一个数据库 (oracle) 加载到另一个数据库 (oracle) 并对其运行一些批处理级别的分析。
到目前为止,它是通过 pl/sql 作业完成的,我们将 3 年的数据提取到目标数据库中。
我有一个任务是使用 APache nifi 自动化流程..
集群信息: 1. 5节点的APache hadoop集群 2.所有软件都是开源的。
我尝试在使用处理器 queryDatabaseTable -> putDatabaseRecord 的情况下创建流。但据我所知,queryDatabaseTable 输出 avro 格式..
我请求建议我如何转换以及处理器序列应该是什么,我还需要处理增量负载/更改数据捕获。请建议。 在此先感谢:)
【问题讨论】:
标签: apache-nifi