【发布时间】:2019-03-22 03:40:35
【问题描述】:
我需要在 python 中使用 boto3 从 S3 存储桶中读取多个 csv 文件,最后将这些文件合并到 pandas 中的单个数据框中。
我可以从以下 python 脚本中读取单个文件
s3 = boto3.resource('s3')
bucket = s3.Bucket('test-bucket')
for obj in bucket.objects.all():
key = obj.key
body = obj.get()['Body'].read()
我的路是这样的
files/splittedfiles/Code-345678
在Code-345678 中,我有多个csv 文件,我必须阅读这些文件并将其组合到pandas 中的单个数据帧中
另外,我如何将所选Codes 的列表作为列表传递,以便它只读取这些文件夹。例如
files/splittedfiles/Code-345678
files/splittedfiles/Code-345679
files/splittedfiles/Code-345680
files/splittedfiles/Code-345681
files/splittedfiles/Code-345682
从上面我只需要读取以下代码下的文件。
345678,345679,345682
如何在 python 中做到这一点?
【问题讨论】:
标签: python csv amazon-s3 boto3