【发布时间】:2020-03-27 02:26:41
【问题描述】:
我已经用
配置了 spark-submit"--conf", "spark.sql.autoBroadcastJoinThreshold=536870912", 512MB
但是 DAG 仍然没有广播连接的较小边。
代码是一个简单的连接。所以我想知道怎么了。
输入是 parquet 文件,存储在 S3 上。
如果需要更多信息进行进一步分析,请告诉我。
【问题讨论】:
标签: performance apache-spark bigdata broadcast