【发布时间】:2020-11-07 01:28:44
【问题描述】:
在使用 pd.cut() 将连续变量转换为分类变量时,空值出现在“age”列中,该列由没有任何空值的“age_in_years”转换而成。这里的解决方案是什么?
df['age_in_years']=df['age_in_days']/365
df.drop('age_in_days',inplace=True,axis=1)
bins=[0,35,60,100]
group=['young','middle_aged','senior']
df['age']=pd.cut(df['age_in_years'],bins,labels=group,right=True).astype('object')
现在当我运行df.isnull().sum() 时,年龄列显示空值
image o/p of df.isnull().sum()
数据集:https://drive.google.com/file/d/11_qSL5tI1epiRcOzueYaMT-1GUiwAQvs/view?usp=sharing
【问题讨论】:
-
您能否提供您的数据框
df的样本,以便重现该问题?尤其是出现问题的行,这可能是由于它们的age_in_years超出范围 [0, 100] -
感谢某些年龄超出范围(0,100)
标签: python pandas dataframe data-science