【发布时间】:2013-10-31 19:36:09
【问题描述】:
我正在尝试找到最大值,因为在熊猫数据框中条件为真。我搜索了类似的问题并阅读了文档,但未能找到讨论的这个问题。为了说明,我想要一个返回 maxsince 列的函数。
In [84]: df
Out[84]:
a b maxsince
2007-04-27 11:00:00 1 True 1
2007-04-27 11:30:00 5 False 5
2007-04-27 12:00:00 3 False 5
2007-04-27 12:30:00 2 True 2
2007-04-27 13:00:00 2 False 2
2007-04-27 13:30:00 7 True 7
2007-04-27 14:00:00 3 False 7
2007-04-27 14:30:00 4 False 7
如果不使用循环,我无法计算这个。什么是最有效的方法?谢谢。
【问题讨论】:
-
df.groupby('b').max() 你在找什么?
-
不,我正在寻找类似 cummax() 的东西,它会在 'b' 中的每个 True 上重置。