【发布时间】:2021-10-01 01:31:33
【问题描述】:
让我们举个例子。 假设我们有一个列名为“f1”的数据框
f1 : {2, 4, NaN, 1, NaN, 15}
当我们对其应用均值插补时,我们会编写这样的代码
dataframe['f1'].fillna(dataframe['f1'].mean())
所以我怀疑它在 dataframe['f1'].mean() 期间计算 f1 的平均值时我知道它在求和期间(在分子中)排除了 NaN 值,因为它们可以'不加,但我想知道的是,除以值的总数时,它可以包含在分母中,也可以排除在分母中。
mean 是这样计算的
mean(f1) = (2+4+1+15)/6(包括 NaN 的总数)
或者这样
mean(f1) = (2+4+1+15)/4(不包括NaN的总数)
还有,解释一下为什么? 提前致谢
【问题讨论】:
标签: python pandas statistics data-science missing-data