【发布时间】:2018-04-11 17:24:49
【问题描述】:
我想做一些非常简单的事情(我相信) 我在 EMR Spark 中运行我的自定义 jar。现在我在做类似的事情
sbt assembly
它创建了一个胖 jar (80MB-120MB),在 S3 中上传很痛苦。
我想要的,是使用
sbt pack
要获取文件夹中的所有 jar,请在 S3 中上传一次,然后每次我想上传新的 jar 时都会上传已编译的,没有依赖项。
我相信 bootstrap.sh 可能会发生这种情况,它将所有 jar 复制到集群,然后使用 --jars 参数。
有人做过吗?
【问题讨论】:
标签: apache-spark amazon-s3 sbt amazon-emr