【问题标题】:Caret error: "all the Accuracy metric values are missing"插入错误:“所有准确度指标值都丢失”
【发布时间】:2015-08-09 03:23:15
【问题描述】:

我收到以下错误,但我不知道可能出了什么问题。 我将 R Studio 与 3.1.3 版本的 R for Windows 8.1 一起使用,并使用 Caret 包进行数据挖掘。

我有以下训练数据:

str(training)

'data.frame':   212300 obs. of  21 variables:

 $ FL_DATE_MDD_MMDD     : int  101 101 101 101 101 101 101 101 101 101 ...

 $ FL_DATE              : int  1012013 1012013 1012013 1012013 1012013 1012013 1012013 1012013 1012013 1012013 ...

 $ UNIQUE_CARRIER       : Factor w/ 13 levels "9E","AA","AS",..: 11 10 2 5 8 9 11 10 10 10 ...

 $ DEST                 : Factor w/ 150 levels "ABE","ABQ","ALB",..: 111 70 82 8 8 31 110 44 53 80 ...

 $ DEST_CITY_NAME       : Factor w/ 148 levels "Akron, OH","Albany, NY",..: 107 61 96 9 9 29 106 36 97 78 ...

 $ ROUNDED_TIME         : int  451 451 551 551 551 551 551 551 551 551 ...

 $ CRS_DEP_TIME         : int  500 520 600 600 600 600 600 600 602 607 ...

 $ DEP_DEL15            : Factor w/ 2 levels "0","1": 1 2 1 1 1 1 1 2 1 1 ...

 $ CRS_ARR_TIME         : int  746 813 905 903 855 815 901 744 901 841 ...

 $ Conditions           : Factor w/ 28 levels "Blowing Snow",..: 2 2 2 2 2 2 2 2 2 2 ...

 $ Dew.PointC           : num  -14.4 -14.4 -14.4 -14.4 -14.4 -14.4 -14.4 -14.4 -14.4 -14.4 ...

 $ Events               : Factor w/ 10 levels "","Fog","Fog-Rain",..: 1 1 1 1 1 1 1 1 1 1 ...

 $ Gust.SpeedKm.h       : num  NA NA NA NA NA NA NA NA NA NA ...

 $ Humidity             : int  68 68 71 71 71 71 71 71 71 71 ...

 $ Precipitationmm      : num  NA NA NA NA NA NA NA NA NA NA ...

 $ Sea.Level.PressurehPa: num  1021 1021 1022 1022 1022 ...

 $ TemperatureC         : num  -9.4 -9.4 -10 -10 -10 -10 -10 -10 -10 -10 ...

 $ VisibilityKm         : num  16.1 16.1 16.1 16.1 16.1 16.1 16.1 16.1 16.1 16.1 ...

 $ Wind.Direction       : Factor w/ 18 levels "Calm","East",..: 9 9 7 7 7 7 7 7 7 7 ...

 $ WindDirDegrees       : int  320 320 330 330 330 330 330 330 330 330 ...

 $ Wind.SpeedKm.h       : num  20.4 20.4 13 13 13 13 13 13 13 13 ...

 - attr(*, "na.action")=Class 'omit'  Named int [1:22539] 3 32 45 87 94 325 472 548 949 1333 ...

  .. ..- attr(*, "names")= chr [1:22539] "3" "32" "45" "87" ...

当我执行以下命令时:

ldaModel <- train(DEP_DEL15~.,data=training,method="lda",preProc=c("center","scale"),na.remove=TRUE)

我明白了:

出了点问题;缺少所有准确度指标值: 精度 Kappa
分钟。 : NA 分钟。 : 不适用
第一区:不适用 第一区:不适用
中位数:NA 中位数:NA
平均值:NaN 平均值:NaN
第三区:不适用 第三区:不适用
最大限度。 : 不适用最大。 : 不适用
北美:1 北美:1
train.default(x, y, weights = w, ...) 中的错误:停止

【问题讨论】:

    标签: r r-caret


    【解决方案1】:

    如果变量 Gust.SpeedKm.hPrecipitationmm 仅包含 NA's,请尝试在运行模型之前从数据中省略这些变量。如果它们包含部分NA's,并且您认为它们可以作为特征具有预测价值,则使用插补。请遵循pre-processing in caret 的此文档,包括估算。

    【讨论】:

    • 我删除了 Gust.SpeedKm.h 和 Precipitationmm 但是当我再次尝试时我得到了类似的结果,但是当我查看警告时,所有的形式都是:15:在 eval(expr, envir , enclos):Resample15 的模型拟合失败:参数=无错误:无法分配大小为 604.2 Mb 的向量我有 26 个类似的警告,我的数据集有 200000 行和至少 20 列。我能做什么?
    【解决方案2】:

    这可能是由于具有“0”和“1”级别的结果因子。

    发生这种情况时会发出特定警告:At least one of the class levels are not valid R variables names; This may cause errors if class probabilities are generated because the variables names will be converted to: X0, X1"

    似乎人们一致地忽略警告,所以我打算在下一个版本中抛出一个错误。

    【讨论】:

      猜你喜欢
      • 2016-07-10
      • 2021-04-01
      • 2017-09-29
      • 2016-01-10
      • 1970-01-01
      • 2015-08-14
      • 2020-11-30
      • 2016-12-21
      • 2021-08-02
      相关资源
      最近更新 更多