【发布时间】:2016-01-26 12:28:42
【问题描述】:
我有一个这样的熊猫数据框
date hour level
0 2015-10-27 0 2.5
1 2015-10-27 1 2.5
2 2015-10-27 2 2.5
3 2015-10-27 3 2.5
4 2015-10-28 0 0.0
5 2015-10-28 1 0.0
6 2015-10-28 2 0.0
7 2015-10-28 3 0.0
8 2015-10-28 4 0.0
...
14 2015-10-29 0 3.23
15 2015-10-29 1 3.23
...
hour 将始终从 0 开始,并以 1 递增;它可能会或可能不会达到 23。date 每次递增一天,但日期条目的数量可能因日期而异,例如- 2015-10-27 有 4 个条目,而 2015-10-28 上升到第 13 行。level 条目在该日期将始终具有相同的值,但该值可能会或可能不会出现在另一个日期。
我想要的是这种形式的字典
{'2015-10-27': '3', ..., '2015-10-29': '4', ...}
字典值表示level落入的范围,即如果level是2.5,那么它落入[2, 3)。我想做的只是选择每个“块”的第一行并创建一个新的数据框,然后遍历该行并应用 10 个 if 语句(级别的最大值为 9.xx)或可能使用上限函数.但是我也不知道该怎么做,而且看起来很笨拙。
有没有更简化的方法来做到这一点?
【问题讨论】:
-
使用
DataFrame.groupby! -
@AlanH 你能更清楚地解释你在做什么吗?您想要每个
date的level的上限吗?如果同一日期有多个级别(来自不同范围)怎么办? -
@AnandSKumar 这不会出现在我的数据框中,这就是为什么我制作了每个分组的所有相同级别条目的示例。
标签: python dictionary pandas dataframe