【发布时间】:2018-04-14 12:00:45
【问题描述】:
# Creating the folds
nfold <- 10
x <- nrow(TrimCredit)
folds <- createFolds(factor(TrimCredit$Class), k = 10, list = FALSE)
TrimCredit$fold <- folds
ddply(TrimCredit, 'fold', summarise, prop = mean(Class)) #Making sure each fold has the same percentage of 1's and 0's (doesn't work when "Class" is a factor?)
falseNegative <- rep(0, nfold)
falsePositive <- rep(0, nfold)
miss = rep(0, nfold)
我的“TrimCredit”数据集中的“类”列是一列设置为因子的 1 和 0(as.factor(Class))。当“类”是一个因素时,ddply 函数将无法正常工作。我尝试了 prop = mean(as.numeric(Class)),但它没有返回正确的百分比。我需要“类”的平均值(1 的百分比),但我不知道怎么做,因为我需要将它作为一个因素。请帮忙!
【问题讨论】:
-
一般来说,您不会采用分类变量的平均值(例如,一袋 M&M 巧克力豆的平均颜色是多少?)但是,一般来说,这里无法帮助您解决问题除非您提供可重现的示例,例如提供
TrimCredit的全部或子集以及其他任何内容,以便上述所有代码在其他人的 R 会话中工作。还需要提供您希望输出的外观,并且可以加快回答问题的时间。谢谢:)
标签: r