【发布时间】:2016-01-19 18:14:30
【问题描述】:
我必须访问 Amazon S3 中存储桶中的一些大文件并对其进行处理。为此,我计划使用 Apache Spark。我有这个学习项目的 2 个 EC2 实例。这些不用于小型 cron,所以我可以使用它们来安装和运行 Spark 吗?如果是这样,如何在现有的EC2盒子上安装Spark,这样我就可以做到一主一从?
【问题讨论】:
-
你运行的是什么风格的 linux?此链接详细介绍了 Ubuntu blog.prabeeshk.com/blog/2014/10/31/… 上的基本 Spark 设置
-
谢谢,浏览了这个站点,但这并没有创建主从结构。它用于本地设置。
标签: amazon-web-services amazon-ec2 amazon-s3 apache-spark