【问题标题】:Perform knn classification with all odd values of k between 1 and 21 in R使用 R 中 1 到 21 之间的所有奇数 k 值执行 knn 分类
【发布时间】:2020-01-04 09:29:35
【问题描述】:

我正在尝试使用 iris 数据集执行 knn,其中 k 的多个奇数值介于 1 - 21(含)之间。结合所有 knn 并仍然获得正确结果的正确方法是什么?另外,我将如何创建结果的混淆矩阵并检查准确性?

在创建混淆矩阵和检查准确性时出现以下错误...

错误 1:表中的错误(knn_class,train.labels): 所有参数的长度必须相同

错误 2:在 ==.default(knn_class, train.labels) 中: 较长的对象长度不是较短对象长度的倍数

当我使用多个 k 执行 knn 时,train.labels 小于 knn_class 但我不明白如何解决。

到目前为止,这是我的代码...

library(class)
data(iris)

# Generate a random sample that is 2/3 of the total number of rows in dataset.
ran <- sample(2, nrow(iris), replace=TRUE, prob=c(0.80, 0.20))
ran

# Compose training labels
train.labels <- iris[ran==1, 5]

# Compose test labels
test.labels <- iris[ran==2, 5]

# Compose training set.
training <- iris[ran==1, 1:4]
data_train <- cbind(train.labels,training)

# Compose test set.
test <- iris[ran==2, 1:4]
data_test <- cbind(test.labels,test)

k_values <- seq(from=1, to=21, by=2)

knn_class <- sapply(k_values, function(k) {
  knn(train = training, test = test, cl = train.labels, k=k)
})
colnames(knn_class) <- c(1,  3,  5,  7,  9, 11, 13, 15, 17, 19, 21)
summary(knn_class)
          1               3               5               7               9               11              13    
 setosa    :13   setosa    :13   setosa    :13   setosa    :13   setosa    :13   setosa    :13   setosa    :13  
 versicolor:11   versicolor:10   versicolor: 9   versicolor: 9   versicolor: 9   versicolor:10   versicolor:10  
 virginica : 9   virginica :10   virginica :11   virginica :11   virginica :11   virginica :10   virginica :10  
          15              17              19              21    
 setosa    :13   setosa    :13   setosa    :13   setosa    :13  
 versicolor:11   versicolor:11   versicolor:10   versicolor:11  
 virginica : 9   virginica : 9   virginica :10   virginica : 9  


# Checking Accuracy of knn.
# Error 1 here.
con_mat <- confusionMatrix(table(knn_class, train.labels))

# Error 2 here.
mean(knn_class == train.labels) # success rate

任何帮助将不胜感激。

【问题讨论】:

    标签: r machine-learning knn


    【解决方案1】:

    第一个问题是您正在使用训练标签来比较您的结果,这会为您提供不同的大小。 KNN 类是一个 25 行到 11 列的矩阵。您需要将结果与测试标签进行比较。

    另一个错误是您需要创建混淆矩阵并获取每个 K 值的准确性。这段代码解决了您的问题:

    accuracy <- c()
    con_mat <- list()
    for(i in 1:ncol(knn_class)) #iterating over columns
    {
      con_mat[[i]] <- table(knn_class[,i], test.labels) #geting the confusion matrix
      accuracy = c(accuracy,mean(knn_class[,i] == test.labels)) #geting the accuracy 
    }
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-02-26
      • 2020-05-23
      • 1970-01-01
      • 2019-06-24
      • 2015-04-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多