【发布时间】:2019-01-17 20:36:47
【问题描述】:
我正在对每个国家的人口统计数据进行分组。我发现我想获取每个组的大小有问题,.size 或 np.size() 返回组的第一列的总和,而不是行数。
我正在使用 Python 3.7 和 Pandas 0.23.4
df.groupby('foo').apply(lambda grp: grp.size)
这会返回一个更大的数字。
Countries.groupby('foo').apply(lambda grp: grp['some colum'].size)
这将给出正确的计数
有人知道为什么.size 在每种情况下的工作方式都不同吗?谢谢!
【问题讨论】:
-
这实际上是我在社区的第一篇文章。如果我的问题或写作不清楚,请告诉我。谢谢大家。
-
试试
Countries.groupby(ContinentDict).size() -
这是什么
ContinentDict?请提供minimal reproducible example? -
我编辑了问题以使其看起来更简洁。斯科特的代码有效。但是为什么当我在
.apply中使用.size时会输出错误呢?
标签: python pandas dataframe pandas-groupby