【发布时间】:2020-06-10 17:58:04
【问题描述】:
我有一些数据要估算,并检查估算的真实值。
- 我采用
iris数据集(没有 NA) - 我随机删除一些结果以产生 NAs
- 然后我应用一个插补函数来尝试插补这些 NA
现在我想检查结果,但只检查 NA 的结果。所以我想用原始的iris 数据提取数据NA 中出现NA 的值,并对ImputedData 执行相同的操作。因此,我可以检查随机生成的 NA 之间的rmse 和其他评估指标,然后用真实结果进行估算。
代码:
library(missForest)
data(iris)
data <- iris
# produce 20% missing values
dataNAs <- prodNA(iris, noNA = 0.2)
ImputeDataFunction <- function(InputData){
ImputedData <- missForest(InputData, mtry = floor(sqrt(ncol(InputData))), ntree = 100)
ImputedData <- ImputedData$ximp
return(ImputedData)
}
ImputedData <- ImputeDataFunction(dataNAs)
【问题讨论】:
-
您是否正在寻找
Iris的子集,其中仅包含dataNAs上存在NA的行?
标签: r