【发布时间】:2021-02-26 16:10:22
【问题描述】:
我想填充年龄特征中的 nan 值。在大火车数据中,pclass 和登船特征是独立的特征。基于这些特征,我想填充年龄特征的 nan 值。 Pclass - (0,1,2) 唯一值,Embarked - ('S','Q','C') 和目标特征 幸存 - (0,1)
对于 pclass、年龄和目标特征(幸存):
sns.catplot(x='Pclass', y='Age',hue='Survived', data=train)
对于 Embarked、年龄和目标特征(幸存):
sns.catplot(x='Embarked', y='Age',hue='Survived', data=train)
但我不知道哪个更好。请告诉我哪个更好来填充年龄特征的nan值
从训练集中删除小屋特征是正确的,它在 891 中有 204 个非空值。请告诉我
【问题讨论】:
标签: python machine-learning feature-engineering