【发布时间】:2019-12-16 02:32:58
【问题描述】:
我有一列包含 16 天、256 天、450 天的值,它是通过减去 2 个日期列(例如 2010-11-10 - 2010-11-1)获得的。我想将日期分为 4 类(0-30 天为 1,30-90 天为 2,90-180 天为 3,大于 180 天为 4)。
我尝试将列转换为分类,然后尝试拆分(16 天为“16”和“天”),但出现错误。
- df_merged['Case_Duration'] = df_merged['DateOfResolution'] -df_merged['DateOfRegistration']
DateOfRegistration 和 DateOfResolution 是日期字段(例如 2010-11-1)
- df_merged['Case_Duration'] = df_merged['Case_Duration'].astype('category')
将“Case_Duration”列转换为类别
- df_Days = df_merged["Case_Duration"].str.split(" ", n = 1, expand = True)
拆分“Case_Duration”列值。 (例如 16 天 -> '16' 和 'days')
但是这一步会报错->只能使用带有字符串值的.str访问器,在pandas中使用np.object_dtype
期望的输出:
【问题讨论】:
标签: python-3.x pandas