【发布时间】:2019-05-07 07:15:53
【问题描述】:
我当前的 DataFrame 是这样的:
Index Animal AnimalClassId
0 [{animalid:1,color:red,name:cat},{animalid:2,color:blue,name:cat2}] 1
1 [{animalid:3,color:pink,name:pig}] 2
所以第一列动物是每行的字典列表。每个 Animal 行都有不同长度的列表。
我的理想输出是:
Index Animal AnimalClassId
0 {animalid:1,color:red,name:cat} 1
1 {animalid:2,color:blue,name:cat2} 1
2 {animalid:3,color:pink,name:pig} 2
此外,这个数据集非常大(超过 100000 行),所以我试图避免循环遍历每一行。有什么快速实施的好方法吗?如有任何建议,我将不胜感激!
【问题讨论】:
-
您为什么不将您的字典取消嵌套到列中?这当然是您面临性能问题的原因:Pandas 系列不是为保存字典而设计的。我建议您将“理想输出”更改为 more 理想。
标签: python pandas list numpy dataframe