【发布时间】:2021-04-07 12:04:45
【问题描述】:
我有一个生成的 CSV 文件
- 没有标题
- 标题和数据在每一行中交替出现(标题不会因行而异)。
例如:
imageId,0,feat1,30,feat2,34,feat,90
imageId,1,feat1,0,feat2,4,feat,89
imageId,2,feat1,3,feat2,3,feat,80
IMO,这种格式是多余且麻烦的(我不明白为什么有人会生成这种格式的文件)。相同数据的 saner/normal CSV(我可以使用 pd.read_csv() 直接读取:
imageId,feat1,feat2,feat
0,30,34,90
1,0,4,89
2,3,3,80
我的问题是,如何将原始数据读入 pd 数据框?现在,我执行read_csv,然后删除所有备用列:
df=pd.read_csv(file, header=None)
df=df[range(1, len(df.columns), 2]
问题是我没有得到标题,除非我特意指定它们。
有没有更简单的方法告诉 pandas 格式的每一行都有数据和标题?
【问题讨论】:
-
可能有一些模糊的业务需求定义了 csv 以这种方式定义,是否没有文档或指导?如果列是一致的,下面的答案会很好用
标签: python-3.x pandas csv