【发布时间】:2020-11-18 13:16:12
【问题描述】:
我有一个包含可变列数的行的 CSV(实际上是制表符分隔的)。前几行的长度相同,比如x,随后的行是可变的(通常更长,比如y)。
我想将此文件读入 pandas 数据帧,其中列数 = 前几行的长度,即 x 列,以及后面的行,包括高达 x 列的值和之后删除那些。
在pd.read_csv 命令中是否有一种优雅的方式来执行此操作?
我曾尝试使用error_bad_lines=False,但这会导致后面的行被删除,而我需要在 col x 处截断它们。请注意,我不提前知道x 是什么,所以也不能简单地对其进行硬编码。
编辑 - 当然这是一个截断的例子 - 这里前几行有 6 个值,最后两行有 10 个值:
Time 0 1 2 3 4 5
alpha 1.35393 1.35393 1.35393 1.35393 1.35393 1.35393
dn 0.015 0.015 0.015 0.015 0.015 0.015
Mu 16.3012 16.3012 16.3012 16.3012 16.3012 16.3012
roll 114.29 114.29 114.29 114.29 114.29 114.29 114.29 114.29 114.29 114.29
timesens 50 50 50 50 50 50 50 50 50 50
我想要一个包含 0:6 的所有行和列的数据框。
【问题讨论】:
-
请显示原始文本文件