【发布时间】:2020-04-01 08:27:31
【问题描述】:
在数据框中,某些行中有一些空 (NaN) 值 - 示例如下
s = pd.DataFrame([[39877380,158232151,20], [39877380,332086469,], [39877380,39877381,14], [39877380,39877383,8], [73516838,6439138,1], [73516838,6500551,], [735571896,203559638,], [735571896,282186552,], [736453090,6126187,], [673117474,12196071,], [673117474,12209800,], [673117474,618058747,6]], columns=['start','end','total'])
当我分组开始和结束列时
s.groupby(['start', 'end']).total.sum()
我得到的输出是
start end
39877380 39877381 14.00
39877383 8.00
158232151 20.00
332086469 nan
73516838 6439138 1.00
6500551 nan
673117474 12196071 nan
12209800 nan
618058747 6.00
735571896 203559638 nan
282186552 nan
736453090 6126187 nan
我想排除所有带有 end 的值都是“nan”的 start 组 - 预期输出 -
start end
39877380 39877381 14.00
39877383 8.00
158232151 20.00
332086469 nan
73516838 6439138 1.00
6500551 nan
673117474 12196071 nan
12209800 nan
618058747 6.00
我尝试使用 dropna(),但它正在删除所有 nan 值而不是 nan 组。
我是 python 和 pandas 的新手。有人可以帮助我吗?谢谢
【问题讨论】:
标签: python pandas pandas-groupby