【发布时间】:2020-04-08 21:16:32
【问题描述】:
我正在参与 Kaggle 上的 data sci 项目的数据,以了解有关 Python 的更多信息,并且正在使用 Iterative Imputer 来估计训练和测试数据集的年龄。
训练数据集891行,测试数据集418行。
在转换测试数据集以使用 imputer 与训练数据集拟合的值后,它添加行以使测试数据集也为 891 行。
非常欢迎任何帮助。
imp = IterativeImputer(max_iter=10, random_state = 1001, min_value=18, max_value=80, missing_values = np.nan)
features = ['Pclass', 'Age', 'SibSp','Parch', 'female', 'male', 'Cherbourg','Queenstown','Southampton']
train_df[features] = imp.fit(train_df[features])
#train_df[features] = imp.transform(train_df[features])
test_df[features] = imp.transform(test_df[features])
【问题讨论】:
标签: python scikit-learn sklearn-pandas