【发布时间】:2017-04-26 16:27:36
【问题描述】:
我正在使用排序基准对 Spark 进行简单的扩展测试——从 1 个核心到 8 个核心。我注意到 8 核比 1 核慢。
//run spark using 1 core
spark-submit --master local[1] --class john.sort sort.jar data_800MB.txt data_800MB_output
//run spark using 8 cores
spark-submit --master local[8] --class john.sort sort.jar data_800MB.txt data_800MB_output
每种情况下的输入和输出目录都在 HDFS 中。
1 个核心:80 秒
8 核:160 秒
我希望 8 核性能具有 x 数量的加速。
【问题讨论】:
-
提供有关您的 CPU、基准测试来源和其他步骤结果的信息
-
您是否看到 spark UI 中使用的所有内核?
标签: performance apache-spark hadoop profiling benchmarking