【发布时间】:2017-06-14 07:02:22
【问题描述】:
我跑
Python 版本:2.7.12 |Anaconda 4.1.1(64 位)| (默认,2016 年 6 月 29 日,11:07:13)[MSC v.1500 64 位 (AMD64)] Pandas 版本:0.18.1 IPython 版本:4.2.0
在 Windows 7 64 上。
什么是获取数据框的快速方法
pd.DataFrame([[1,'a',1,'b',2,'c',3,'d',4],
[2,'e',5,'f',6,'g',7],
[3,'h',8,'i',9],
[4,'j',10]],columns=['ID','var1','var2','newVar1_1','newVar1_2','newVar2_1','newVar2_2','newVar3_1','newVar3_2'])
来自
pd.DataFrame([[1,'a',1],
[1,'b',2],
[1,'c',3],
[1,'d',4],
[2,'e',5],
[2,'f',6],
[2,'g',7],
[3,'h',8],
[3,'i',9],
[4,'j',10]],columns=['ID','var1','var2'])
我要做的是按 ID 分组,然后在 groupby 对象上迭代以从每个项目创建一个新行并将其附加到最初为空的数据帧上,但这很慢,因为在实际情况下,起始行数据框有几千个。
有什么建议吗?
【问题讨论】:
标签: pandas pandas-groupby