【问题标题】:Removing MULTIPLE outliers in regression model in R去除 R 中回归模型中的多个异常值
【发布时间】:2015-07-09 00:50:28
【问题描述】:

这是在R中

好的,所以我使用烹饪距离来识别我想从我拥有的 506 个变量的数据集中删除的点。

我可以删除一个点(编号 369),如下所示:

modelmc1 = lm(housing[-369,14] ~ housing[-369,1] + housing[-369,2] + 
housing[-369,3] + housing[-369,4] + housing[-369,5] + housing[-369,6] + 
housing[-369,7] + housing[-369,8] + housing[-369,9] + housing[-369,10] + 
housing[-369,11] + housing[-369,12] + housing[-369,13])

我的问题是如何删除多个点(大约 30)

谢谢

【问题讨论】:

  • 您是否将点存储在对象中?说像 outlier.index 什么的?然后执行housing.wo.outliers <-housing[-outlier.index,]lm 执行此lm("var.name" ~ ., data = housing.wo.outliers),其中 var.name 是索引 14 处的列的名称

标签: r regression outliers


【解决方案1】:

您可以使用向量c() 在数据框中省略多行。

modelmc1 = lm(housing[c(-361, -367, -369),14] ~ housing[c(-361, -367, -369),1] + ...)

【讨论】:

    猜你喜欢
    • 2016-07-01
    • 2018-10-04
    • 1970-01-01
    • 2012-05-21
    • 2018-12-18
    • 2021-12-07
    • 1970-01-01
    • 2015-07-13
    • 2015-03-11
    相关资源
    最近更新 更多