【发布时间】:2015-07-28 04:59:16
【问题描述】:
如何在 spark 中加速 leftouterjoin
我在 Spark 中工作。
leftouterjoin 成为整个工作的瓶颈。
所以有必要对spark中的leftouterjoin进行优化。
它是 200 万条数据集记录之间的左外连接。
计算 leftouterjoin 需要 8 分钟
13
leftOuterJoin at :26
2015/07/28 04:38:16 8.3 分钟 7/7
152.7 MB 50.5 MB 278.5 MB
【问题讨论】:
标签: python optimization apache-spark left-join query-optimization