【发布时间】:2014-07-14 12:03:17
【问题描述】:
我正在尝试在本地构建 Apache Spark。这样做的原因是为了调试像 reduce 这样的 Spark 方法。特别是我对 Spark 如何在后台实现和分发 Map Reduce 感兴趣,因为我遇到了性能问题,我认为从源代码运行这些任务是找出问题所在的最佳方法。
所以我从 Spark repo 克隆了最新的:
git clone https://github.com/apache/spark.git
Spark 似乎是一个 Maven 项目,所以当我在 Eclipse 中创建它时,结构如下:
一些顶级文件夹也有 pom 文件:
那么我应该只构建这些子项目之一吗?这些是针对本地代码库运行 Spark 的正确步骤吗?
【问题讨论】:
-
要查看 Spark 内部结构,您只需要
core。这应该会让你到达那里:syndeticlogic.net/?p=311 BTW,SBT 更好地让 Spark 启动并运行。我还建议您使用 Intellij 而不是 Eclipse。
标签: eclipse scala maven apache-spark