【发布时间】:2015-07-09 00:50:28
【问题描述】:
这是在R中
好的,所以我使用烹饪距离来识别我想从我拥有的 506 个变量的数据集中删除的点。
我可以删除一个点(编号 369),如下所示:
modelmc1 = lm(housing[-369,14] ~ housing[-369,1] + housing[-369,2] +
housing[-369,3] + housing[-369,4] + housing[-369,5] + housing[-369,6] +
housing[-369,7] + housing[-369,8] + housing[-369,9] + housing[-369,10] +
housing[-369,11] + housing[-369,12] + housing[-369,13])
我的问题是如何删除多个点(大约 30)
谢谢
【问题讨论】:
-
您是否将点存储在对象中?说像 outlier.index 什么的?然后执行
housing.wo.outliers <-housing[-outlier.index,]和lm执行此lm("var.name" ~ ., data = housing.wo.outliers),其中 var.name 是索引 14 处的列的名称
标签: r regression outliers