【发布时间】:2016-02-07 01:34:11
【问题描述】:
在我的机器上,我配置了 hadoop core-site.xml 以识别 gs:// 方案,并将 gcs-connector-1.2.8.jar 添加为 Hadoop 库。我可以运行hadoop fs -ls gs://mybucket/ 并获得预期的结果。但是,如果我尝试从 java 中使用:
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(conf);
FileStatus[] status = fs.listStatus(new Path("gs://mybucket/"));
我在本地 HDFS 中而不是 gs://mybucket/ 中获取根目录下的文件,但这些文件以 gs://mybucket 开头。如果我在获取fs之前用conf.set("fs.default.name", "gs://mybucket");修改conf,那么我可以在GCS上看到文件。
我的问题是:
1. 这是预期的行为吗?
2.使用这个hadoop FileSystem api相对于google云存储客户端api有什么缺点吗?
【问题讨论】:
标签: google-cloud-dataproc google-hadoop