【发布时间】:2020-08-04 11:27:02
【问题描述】:
我有一个从 2019 年 8 月到 2020 年 4 月的数据框。
我想向这个数据框添加一个列/分类变量,然后按这个新引入的列进行分组和聚合。
我在这个数据框中有一个日期列。
type(df["Date"].iloc[0]) 计算结果为 datetime.date
我在这个数据框中还有一列表示周df["Week]。
到目前为止,我已经写了一个函数,它根据星期进行分类:
def time_intervals(week):
if 33 <= week < 35:
return "Interval 1"
elif 35 <= week < 37:
return "Interval 2"
....
然后将此函数映射到现有列。
df["Interval"] = df["Week"].map(time_intervals)
现在这不是最聪明的解决方案,一旦数据在 2019 年和 2020 年之间重叠,肯定会引起问题。有没有更聪明的方法在 pandas 中创建这样的间隔?
【问题讨论】:
标签: python pandas dataframe timestamp range