【发布时间】:2021-08-11 12:29:55
【问题描述】:
我们正在运行托管在私有数据中心上的 Spark,并尝试从 GCP 存储中读取数据。我正在使用下面的代码 sn-p 来读取.csv。
val sparkConf = new SparkConf
sparkConf.setAppName("gcp-storage-reader")
sparkConf.setMaster("local[*]")
sparkConf.set("google.cloud.auth.service.account.json.keyfile", "<json key file>")
val sparkSession = SparkSession.builder().config(sparkConf).getOrCreate()
sparkSession
.read
.csv("gs://input/test.csv")
.show(2)
是否有传递.json 密钥内容,而不是私钥json 的路径。例如,我们可以通过设置spark.conf.set("credentials", "<SERVICE_ACCOUNT_JSON_IN_BASE64>") 来访问BigQuery。我们是否也可以从 GCP 存储中读取数据?
【问题讨论】:
标签: apache-spark google-cloud-platform google-cloud-storage google-authentication