【发布时间】:2020-09-23 13:30:23
【问题描述】:
我正在处理一个电子表格,并想创建一个线性模型来考虑几个变量如何影响研发支出。其中一个变量(称为 CEO)指出 CEO 是否拥有博士学位。这在数据中可以识别为 CEO = 1(拥有博士学位),CEO = 0(没有博士学位)。当我为只有 CEO 的线性模型编写代码时,它会同时考虑两者,这使得很难解释每个人如何分别对研发支出产生影响。
#This is my initial code:
reg3 <- lm(RD.exp ~ NETincome*Assets..total.*CEO,
data = data1,
na.action=na.omit)
我想过滤它,以便我可以运行相同的回归,但只考虑 CEO = 1。 我试过通过 dplyr 过滤它,但没有用。我也试过这行代码:
CEO1 <- data3[which(data3$CEO==1),]
但这会使数据再次变成 chr,当我尝试使用 as.numeric 时,它不会将其变回 num。
那么我们的想法是让代码看起来像这样:
reg3 <- lm(RD.exp ~ NETincome*Assets..total.*CEO1,
data = data1,
na.action=na.omit)
非常感谢您对此的任何帮助!
谢谢
【问题讨论】:
-
嗨,请向我们展示 dput(head(data1, 5)) 的输出。当您说“dplyr 但它不起作用”时,您是什么意思?
-
lm(..., data=..., subset= CEO==1) -
或
lm(..., data=..., subset= CEO=="1")如果 $CEO 是字符。