【发布时间】:2016-10-14 06:46:30
【问题描述】:
我使用了 Nifi-0.6.1 和 GetFile+SplitText+ReplaceText 处理器的组合来拆分具有 30MB(300 000 行)的 csv 数据。
GetFile 能够非常快速地将 30mb 传递给 SplitText。
In SpliText +Replace Text 需要 25 分钟才能将数据拆分为 Json。
仅 30 mb 的数据需要 25 分钟才能将 csv 存储到 SQL Server。 它逐字节执行转换。
我已经尝试过处理器中的并发任务选项。它可以加快速度,但也需要更多时间。那时它达到了 100% cpu Usage。
如何更快地将 csv 数据执行到 sql Server 中?
【问题讨论】:
-
“30 万行”?!这意味着什么?此外,还有本机 BULK INSERT 语句将 CSV 数据加载到 SQL Server 中。也许你先试试这个。
-
我只能在 SQL Server 中执行批量插入。但我的情况完全集中在 Apache Nifi 处理器中。
-
再次尝试解决问题。请不要只回滚那些试图对你的真正糟糕的语法/语言更有意义的更改。
标签: json csv apache-nifi