【发布时间】:2021-06-15 11:14:02
【问题描述】:
我的 s3 中有不同的文件。现在我想获取以 cop_ 开头的文件。为了实现这一点,我尝试了以下方法:-
source = s3-path
files = [filename for filename in dbutils.fs.ls(source) if filename.startswith('cop_ ')]
print(files)
尝试后出现如下错误:-
AttributeError: 'FileInfo' object has no attribute 'startswith'
S3 文件夹的文件名如下:-
cop_new.csv
public_new.csv
cop_old.csv
public_old.csv
异常输出:-
[cop_new.csv,cop_old.csv]
【问题讨论】:
-
你能试试
filename.name.startswith('cop_ ')吗?
标签: csv file amazon-s3 pyspark