【发布时间】:2021-04-29 14:49:54
【问题描述】:
我正在尝试用平均值替换 NaN,但是当我执行 fit 方法时出现此错误:
ValueError: 输入包含 NaN、无穷大或一个太大的值 dtype('float64').
这是我的代码:
from sklearn.impute import SimpleImputer
imp = SimpleImputer(missing_values = "NaN", strategy = "mean")
imp = imp.fit(df_missing.iloc[:, 1:4])
在您将其标记为转发之前,我知道我也可以导入 numpy 并使用 np.nan 而不是“NaN”,但是没有办法解决它并坚持使用 pandas 和 SimpleImputer 吗?我正在学习在线课程,我想尽可能地坚持下去;不幸的是,它显然已经过时了,例如,它仍在运行
from sklearn.preprocessing import Imputer
【问题讨论】:
-
df.fillna(df.mean())? -
建议实际上是为了熟悉 sklearn,我知道我可以用 pandas 或 numpy 来做,但我想知道我是否也可以用 SimpleImputer 来做
标签: python pandas scikit-learn