【发布时间】:2017-06-23 10:35:24
【问题描述】:
在我的代码中,我收到了这样的结果:
A B C
1 1 1
A B C
2 2 2
A B C
3 3 3
我需要将这些列(数据框)合并到一个大数据框 喜欢
A B C
1 1 1
2 2 2
3 3 3
要合并来自不同文件的数据框,就像pd.merge(df1,df2) 一样容易,但是当数据框在一个文件中时如何做到这一点?
感谢您的建议!
编辑: 为了接收我的数据,我将数据集中的行转换为数据帧,并且我在一个输出中接收到每一行的每个数据集。 我的代码:
def coordinates():
with open('file.txt') as file:
for lines in file:
lines =StringIO(lines[35:61]) #i need only those fields in each line
abc=pd.read_csv(lines,sep=' ',header=None)
abc.columns=['A', 'B', 'C','D','E','F']
print abc
coordinates()
编辑2: 来自 s_vishnu 的建议仅适用于具有相同多个标题的已准备文件。但在我的情况下,我为文件生成了多个 DataFrame,并且标题后的每一行都有 0 值。它有很多数据框,每个只有一行。
编辑3:
在我的file.txt 中,我有很多行,大约有 80 个字母,如下所示:
AAA S S SSDAS ASDJAI A 234 33 43 234 2342999 2.31 22 33
SSS S D W2UUQ Q231WQ A 222 11 23 123 1231299 2.31 22 11
从那一行我只需要部分信息,这就是为什么我用lines =StringIO(lines[35:61]) 来获取这些信息。在这个例子中,我需要字母
[30:55] 并使用columns=['A', 'B', 'C','D','E','F'] with sep=' ' 创建数据框
【问题讨论】:
-
也许这个问题的答案会对你有所帮助:stackoverflow.com/questions/44715393/…