【发布时间】:2014-06-12 15:17:49
【问题描述】:
计算 Pandas 系列中元素出现次数的最快方法是什么?
我目前最快的解决方案是.groupby(columnname).size()。 Pandas 中有什么更快的东西吗?例如。我想要以下内容:
In [42]: df = DataFrame(['a', 'b', 'a'])
In [43]: df.groupby(0).size()
Out[43]:
0
a 2
b 1
dtype: int64
【问题讨论】:
-
担心这个级别的优化似乎是在浪费时间,但你可以试试
value_counts:它应该有更少的开销。