【发布时间】:2019-09-20 01:14:02
【问题描述】:
我的数据集中有很多连续的自变量和一个因变量,这些变量是关于给定年份的个人的。我想使用逻辑随机效应套索/逻辑固定效应套索执行特征选择。但是,我的估计过程的glmnet 的默认设置是我使用横截面数据,而我希望R 将我的数据视为面板数据,因此它在我想要一个逻辑随机效应的同时模拟一个逻辑套索Lasso/Logistic 固定效应 Lasso 模型。
因此,在下面的示例代码中,我想让R 知道我正在使用面板数据集,ID 是我的个人/横截面单位,year 是我观察到的年份对于每个ID。在下面的代码中,所有个体都被汇集在一起,我什至在这个 Logistic Lasso 估计中得到了ID(和year)的系数。如何估计 R 中的 Logistic 随机效应 Lasso/Logistic 固定效应 Lasso 模型?
df=cbind(c(1,546,2,56,6,73,4234,436,647,567,87,2,5,76,5,456,6756,6,132,78,32),c(2,3546,26,568,76,873,234,36,67,57,887,29,50,736,51,56,676,62,32,782,322),10:30)
year=rep(1:3, times=7)
ID=rep(1:7, each=3)
x=as.matrix(cbind(ID,year,df))
y1=as.data.frame(rep(c(0,1), each = 18))[1:21,]
y=as.matrix(y1)
fit=glmnet(x,y,alpha=1,family="binomial")
lambdamin=min(fit$lambda)
predict.glmnet(fit,s=lambdamin,newx=x,type="coefficients")
1
(Intercept) -8.309211e+01
ID 1.281220e+01
year .
-2.339904e-04
.
.
【问题讨论】:
标签: r panel lasso-regression