【发布时间】:2017-02-20 12:04:14
【问题描述】:
我正在为 spark 编写一个谷歌大查询连接器,在它下面使用谷歌 hadoop 连接器。
目前,google hadoop 连接器需要一个指向 creds json 文件的 Google 环境变量。
当您在 dataproc 世界之外启动集群时,设置这可能很烦人
在代码中实时设置是不好的做法吗?还是有一种解决方法可以告诉hadoop连接器忽略env变量,因为它是在“fs.gs.auth.service.account.json.keyfile”hadoop配置中设置的?
Dennis 既然你是这个项目的贡献者,这次也许你也可以帮忙?
【问题讨论】:
-
@dennis-huo 你被提到了
-
嗯,我不记得在哪里使用了环境变量;它应该只使用 Hadoop 配置键。你有一个指向代码环境变量在哪里被使用的指针吗?
-
@DennisHuo 它在创建客户端时使用 val bigquery = { val credential = GoogleCredential.getApplicationDefault.createScoped(SCOPES) new Bigquery.Builder(new NetHttpTransport, new JacksonFactory, credential) .setApplicationName("spark- bigquery") .build()
标签: hadoop apache-spark google-bigquery