【发布时间】:2017-10-30 03:49:43
【问题描述】:
我正在使用 AWS EMR 上的 sqoop 将 20 亿条记录从 hive 导出到 Oracle 数据库。我已经尝试了 --batch 和 --num-mappers 参数,它们已经帮助提高了性能。
调整-Dsqoop.export.statements.per.transaction 和-Dsqoop.export.records.per.statement 有帮助吗?
期待有关其他调整参数的建议,以提高导出吞吐量。
【问题讨论】:
标签: oracle hadoop export performance-testing sqoop