【发布时间】:2019-10-10 19:27:41
【问题描述】:
据了解,在从 oracle db 迁移/加载到 hdfs/parquet 时,最好使用 SQOOP 而不是带有 JDBC 驱动程序的 SPARK。
Spark 在处理时应该快 100 倍吧? 那么 Spark 有什么问题呢? 为什么人们在从 oracle db 表中加载数据时更喜欢 SQOOP?
请建议我在从 oracle 加载数据时应该如何使 Spark 更快。
【问题讨论】:
标签: apache-spark jdbc sqoop datastax