【问题标题】:S3 checkpointing for spark streaming leads to an error火花流的 S3 检查点导致错误
【发布时间】:2016-01-19 00:35:12
【问题描述】:

我已使用 getOrCreate 方法为我的 sparkstreaming 应用程序启用检查点。检查点目录指向 S3 存储桶。 我遇到的问题是访问 S3 时的凭据问题:

原因:java.lang.IllegalArgumentException:AWS 访问密钥 ID 和秘密访问密钥必须分别指定为 s3 URL 的用户名或密码,或者通过设置 fs.s3.awsAccessKeyId 或 fs.s3。 awsSecretAccessKey 属性(分别)。

我已经设置了环境变量(AWS_SECRET_KEY 和 AWS_ACCESS_KEY)。 我的 fs.s3.awsAccessKeyId 或 fs.s3.awsSecretAccessKey 也已在 application.conf 中指定。所以我不知道为什么它仍然失败。

【问题讨论】:

    标签: amazon-s3 apache-spark spark-streaming


    【解决方案1】:

    环境变量(AWS_SECRET_KEY 和 AWS_ACCESS_KEY)在 Spark 1.3 之后不再起作用。

    新方法请参考:
    How to read input from S3 in a Spark Streaming EC2 cluster application

    val conf = new SparkConf().setAppName("Simple Application").setMaster("local")      
    val sc = new SparkContext(conf)
    val hadoopConf=sc.hadoopConfiguration;
    hadoopConf.set("fs.s3.impl", "org.apache.hadoop.fs.s3native.NativeS3FileSystem")
    hadoopConf.set("fs.s3.awsAccessKeyId",myAccessKey)
    hadoopConf.set("fs.s3.awsSecretAccessKey",mySecretKey)
    

    【讨论】:

      猜你喜欢
      • 2018-08-26
      • 1970-01-01
      • 1970-01-01
      • 2016-09-23
      • 1970-01-01
      • 1970-01-01
      • 2019-08-25
      • 2018-08-15
      • 2017-10-01
      相关资源
      最近更新 更多