【发布时间】:2015-10-18 07:43:29
【问题描述】:
实际上我需要使用线性回归计算参数 theta0 和 theta1。
我的数据框(data.1)由两列组成,第一列是日期时间,第二列是取决于此日期的结果。
像这样:
data.1[[1]] data.1[[2]]
2004-07-08 14:30:00 12.41
现在,我有这段代码,它会迭代多次以计算参数theta0、theta1
x=as.vector(data.1[[1]])
y=as.vector(data.1[[2]])
plot(x,y)
theta0=10
theta1=10
alpha=0.0001
initialJ=100000
learningIterations=200000
J=function(x,y,theta0,theta1){
m=length(x)
sum=0
for(i in 1:m){
sum=sum+((theta0+theta1*x[i]-y[i])^2)
}
sum=sum/(2*m)
return(sum)
}
updateTheta=function(x,y,theta0,theta1){
sum0=0
sum1=0
m=length(x)
for(i in 1:m){
sum0=sum0+(theta0+theta1*x[i]-y[i])
sum1=sum1+((theta0+theta1*x[i]-y[i])*x[i])
}
sum0=sum0/m
sum1=sum1/m
theta0=theta0-(alpha*sum0)
theta1=theta1-(alpha*sum1)
return(c(theta0,theta1))
}
for(i in 1:learningIterations){
thetas=updateTheta(x,y,theta0,theta1)
tempSoln=0
tempSoln=J(x,y,theta0,theta1)
if(tempSoln<initialJ){
initialJ=tempSoln
}
if(tempSoln>initialJ){
break
}
theta0=thetas[1]
theta1=thetas[2]
#print(thetas)
#print(initialJ)
plot(x,y)
lines(x,(theta0+theta1*x), col="red")
}
lines(x,(theta0+theta1*x), col="green")
现在我想使用以下场景计算 theta0 和 theta1:
-
y=data.1[[2]]和x=dates无论年份如何,都是相似的 -
y=data.1[[2]]和x=months无论年份如何,都是相似的
请建议..
【问题讨论】:
-
R中的线性回归是通过lm函数实现的。详情请见?lm。 -
@Mohit 如果我的回答对您有所帮助,请将其标记为已接受 :)
标签: r datetime regression linear-regression