【发布时间】:2017-08-20 12:10:51
【问题描述】:
我创建了这个示例数据
pd.DataFrame.from_items([(0,['a1', 'a1', 'a2', 'a2']), (1,['b1', 'b1', 'b2', 'b2']), (2,['m', 'n', 'o', 'p'])])
0 1 2
0 a1 b1 m
1 a1 b1 n
2 a2 b2 o
3 a2 b2 p
我想将此数据框“减少”为具有“0”列中唯一值的索引,然后作为列返回“2”列中值的数组。 例如
'2'
Index
a1 [m,n]
a2 [o,p]
因此,我需要将其作为数据框,因为我想将生成的数据框连接到另一个数据框。它们都“相当”大(18mio 行)。 我尝试使用堆栈,但我不知道该怎么做。我尝试使用数据透视表,但是 col '2' 中的值在标题中,而不是用作值。任何帮助将不胜感激!
【问题讨论】:
标签: python list python-3.x pandas group-by