【发布时间】:2018-04-16 15:07:51
【问题描述】:
我有一个非常杂乱无章的数据集,位于一个文本文件中,比如file.txt
样本看起来像这样
TYPE Invoice C AC DATE TIME Total Invoice Qty1 ITEMVG By Total 3,000.00
Piece Item
5696 01/03/2018 09:21 32,501.35 1 Golden Plate ÞÔÞæÇä ÈÞÑ 6,517.52
1 áÈä ÑæÇÈí ÊÚäÇíá 2 ßÛ 4,261.45
1 Magic chef pop corn 907g 3,509.43
1 áÈäÉ ÊÚäÇíá ÔÝÇÝÉ 1 ßíáæ 9,525.60
1 KHOURY UHT 1 L 2,506.74
1 ÎÈÒ ÔãÓíä ÕÛíÑ 1,002.69
2 Almera 200Tiss 2,506.74
1.55 VG Potato 1,550.17
0.41 VG Eggplant 619.67
1 Delivery Charge 501.35
5697 01/03/2018 09:31 15,751.35 0.5 Halloum 1K. 4,476.03
0.59 Cheese double Cream 3,253.75
3 ãæáÇä 쾄 ÎÈÒ æÓØ 32 3,760.11
3 ãæáÇä 쾄 ÎÈÒ æÓØ 32 3,760.11
1 Delivery Charge 501.35
我想使用多索引将其导入数据框 pandas。有人可以帮我解决这个问题吗?
事实上它无法将其作为txt文件读取
# Obtain the Unorganized data from txt
file1=open('file.txt','r')
UnOrgan=file1.read()
【问题讨论】:
-
@ASGM 问题与错误无关。问题是如何格式化此 txt 数据以将它们作为数据框导入。谢谢
-
@ASGM 您能否删除重复项,因为这不是重复的问题。谢谢
-
是的,我已经删除了。
标签: python-3.x pandas multi-index