【发布时间】:2018-04-19 19:45:12
【问题描述】:
我有一个s3 存储桶,我在其中存储要由我的 pyspark 代码处理的数据文件。
我要访问的文件夹是:
s3a://bucket_name/data/
此文件夹包含文件夹。我的目标是访问此目录中最后添加的文件夹的内容。 由于某些原因,我不想使用 boto。 有什么方法可以访问文件夹列表,所以我可以选择我想访问的文件夹。 如果我指定文件夹,我可以访问文件,但我想让它动态化。
【问题讨论】:
标签: dataframe amazon-s3 pyspark s3-bucket