【发布时间】:2017-05-20 18:47:49
【问题描述】:
我有一个包含一些模型文件的目录,由于某种原因,我的应用程序必须访问本地文件系统中的这些模型文件。
当然我知道spark-submit 的--files 选项可以将文件上传到每个执行器的工作目录,它确实有效。
但是,我想保留文件的目录结构,所以我想出了--archives 选项,据说
YARN-only:
......
--archives ARCHIVES Comma separated list of archives to be extracted into the working directory of each executor.
......
但是当我实际使用它来上传models.zip 时,我发现yarn 只是把它放在那里没有提取,就像它对--files 所做的那样。我是否误解了to be extracted 或误用了这个选项?
【问题讨论】:
标签: scala apache-spark zip hadoop-yarn