【发布时间】:2017-12-26 06:42:52
【问题描述】:
我正在尝试使用 R 估计面板数据的逻辑单元固定效应模型。我的因变量是二进制的,并且在两年内每天测量 13 个位置。 该模型的目标是根据 x 预测特定日期和位置的 y 值。
zero <- seq(from=0, to=1, by=1)
ids = dplyr::data_frame(location=seq(from=1, to=13, by=1))
dates = dplyr::data_frame(date = seq(as.Date("2015-01-01"), as.Date("2016-12-31"), by="days"))
data = merge(dates, ids)
data$y <- sample(zero, size=9503, replace=TRUE)
data$x <- sample(zero, size=9503, replace=TRUE)
在调查可用的软件包时,我已经阅读了许多(显然)这样做的方法,但我不确定我是否理解了软件包和方法之间的区别。
从我目前所读到的内容来看,glm()、survival::clogit() 和 pglm::pglm() 可用于执行此操作,但我想知道这些软件包之间是否存在实质性差异以及可能是什么。
以下是我使用过的电话:
fixed <- glm(y ~ x + factor(location), data=data)
fixed <- clogit(y ~ x + strata(location), data=data)
造成这种不安全的原因之一是我在使用 pglm(另见 this question)时遇到的错误,即 pglm 不能使用“within”模型:
fixed <- pglm(y ~ x, data=data, index=c("location", "date"), model="within", family=binomial("logit")).
pglm 的“内部”模型与glm() 和clogit() 中的方法有什么区别?在尝试预测给定日期和单位的 y 时,这三种方法中的哪一种是正确的?
【问题讨论】:
-
阅读
?glm后,您应该能够回答您的第一个问题。不鼓励在 SO 上提出多部分问题。请阅读minimal reproducible example 并使用edit 工具来缩小您的问题并提供要编码的任务的具体示例。 -
阅读 ?glm 后我无法回答我的第一个问题,这就是我在这里问的原因。但是,我重新提出了我的问题并使其可重现。
-
错误:'date_frame' 不是从 'namespace:dplyr' 导出的对象
标签: r logistic-regression panel-data