【发布时间】:2016-06-09 16:27:01
【问题描述】:
抱歉,这可能是一个非常基本的问题。
我使用多元回归为海量气象数据集创建了一个线性模型。我的目标是使用该模型使用预测变量 1、2 和 3 在某个时期内“预测”数据。然后,我会将这些预测数据与该时期的观察数据进行比较。
到目前为止,我的方法是为预测值创建一个新向量并循环遍历该向量,根据提取的线性模型系数创建预测值。然后,我将简单地从观察值中减去预测值。由于某种原因,这种方法导致新的预测向量为 NULL。知道我该如何处理吗?
下面是一个示例。 “数据”是指包含预测变量的数据集。
coef <- coefficients(multipleRegressionModel)
predictedValues=c()
for(i in 1:length(data$timePeriod)){
predictedValues[i] = append(predictedValues, data$coef[1]+data$predictor1[i]*data$coef[2]+data$predictor2[i]*data$coef[3]+
data$predictor3[i]*data$coef[4])
}
diff=c()
diff=observedValues - predictedValues
【问题讨论】:
-
为什么要循环播放?只需执行
predict(multipleRegressionModel, newdata = data)。此外,不要在循环中增长对象,即不要使用append。这太慢了。 -
谢谢!我不知道预测功能。
标签: r