【发布时间】:2021-07-15 00:41:28
【问题描述】:
我是新来的,也是 python 初学者。我收到了一个包含 100k 行的文本文件,每行包含 120 个字符。每行代表 14 列的数据,但由于某些值较短,而另一些值则用空白填充。这样我就没有像“,”这样的分隔符。如果我选择空白作为分隔符,值将不会进入正确的列。
线条就像
- 字符 1:O 或 L
- 第2-5章:年份
- 字符 6-13:月份名称
- 字符 14-21:汽车品牌
- 字符 22:.
O2020august Opel .
L2015may BMW .
L2016april Mercedes.
O2021january Opel .
L2023februaryAudi .
我被困住了
df = pd.read_csv('text.txt', index_col=0, header = None)
print (data)
对于建议的任何方法,我都很高兴。不需要是熊猫。
干杯珍妮
【问题讨论】:
-
请从intro tour 重复on topic 和how to ask。 “告诉我如何解决这个编码问题”不是堆栈溢出问题。我们希望您做出诚实的尝试,然后然后就您的算法或技术提出一个具体的问题。 Stack Overflow 无意取代现有的文档和教程。
-
让我提供一点提示
brand = line[14:22].rstrip()。 -
嘿@Prune,很抱歉我不想将此网站用作教程,但我真的不知道如何继续。我也检查不同的论坛。如前所述,我不知道我可以使用什么作为分隔符。我试图创建一个列表,但这让我无处可去。按原样分离空白值。 file = open('text.txt', 'r') for line in file: line = line.strip() columns = line.split() print(columns)
-
@TimRoberts:谢谢你的帮助!
-
被“卡住”并不会使问题适合 Stack Overflow。同样,请参阅发布指南。相反,您似乎需要一个通用帮助网站。
标签: python pandas string split