【发布时间】:2014-05-13 11:17:28
【问题描述】:
我的决赛桌在 Hive(HDFS) 中
1) 我已经厌倦了“Sqoop” 2) sql加载器 3) oraoop
所有的性能都非常令人沮丧,而我们正在将数据放入 sql 数据库中
必须导入 1 TB 文件,并且 1 GB 使用 sqoop、oraoop、sql 加载器在 5 节点集群中接管所有 8 分钟(1297372920 行)
【问题讨论】:
-
那么,你的问题在哪里?
-
通过 sqoop、oraoop、sql loader 将数据加载到 oracle 中,它们都需要相同的时间,所以我们如何快速将数据从 hadoop 导出到 oracle
标签: oracle hadoop mapreduce hive sqoop