我使用函数创建了一个简单的解决方案,以便您可以对任何数据框 (data) 和任何添加到“colB”的值序列 (add) 执行此操作。
# data has a column named 'colB' from which we cant to predict with added values.
# add is the vector of adding values to colB
'glm_add' <- function(data, add = seq(0.1, by = 0.1, length.out = nrow(data))){
data <- cbind.data.frame(data, colB_add = data$colB + add)
glm <- glm(colA ~ colB, data = data)
glm_add <- glm(colA ~ colB_add, data = data)
pred <- predict(glm, data)
pred_add <- predict(glm_add, data)
return(list(pred = pred, pred_add = pred_add))
}
复制一个例子来测试功能:
data <- data.frame(colA = rnorm(10), colB = rnorm(10))
res <- glm_add(data)
以初始“colB”作为协变量的 glm 预测:
> res$pred :
1 2 3 4 5 6 7 8 9 10
0.13415502 0.17283282 0.27074470 0.47279826 0.01846426 0.13072748 0.21737383 0.12426569 0.25197290 0.30230644
使用 colB+0.1, colB+0.2, colB+0.3, ... 作为协变量的 glm 预测:
> res$pred_add
1 2 3 4 5 6 7 8 9 10
0.19407251 0.23911968 0.39659313 0.75172751 -0.13896182 0.04575049 0.18184197 -0.02324061 0.19078440 0.25795416
编辑:
作者实际上要求 从任何修改过的数据帧中预测 colB_add 的每个元素都添加了相同的值 0.1,然后是 0.2,等等。
为此,我将使用lapply() 创建一个data_list,其中每个元素都是具有适当colB_add 列的数据框。
add <- seq(0.1, by = 0.1, length.out = nrow(data))
data_list <- lapply(1:length(add), function(i) cbind.data.frame(data, colB_add = data$colB + add[i]))
然后,我将每个预测放入一个列表中
pred_list <- list()
> lapply(1:length(add), function(x){
+ glm <- glm(colA ~ colB_add, data = data_list[[x]])
+ pred_list[[x]] <<- predict(glm, data_list[[x]])
+ })
[[1]]
1 2 3 4 5 6 7 8 9 10
-0.25321920 0.93795112 -0.04791986 -0.51229077 -0.20971718 0.36441752 0.38477508 -0.26853199 -0.00754999 0.04868279
[[2]]
1 2 3 4 5 6 7 8 9 10
-0.25321920 0.93795112 -0.04791986 -0.51229077 -0.20971718 0.36441752 0.38477508 -0.26853199 -0.00754999 0.04868279
[[3]]
1 2 3 4 5 6 7 8 9 10
-0.25321920 0.93795112 -0.04791986 -0.51229077 -0.20971718 0.36441752 0.38477508 -0.26853199 -0.00754999 0.04868279
请注意,这会为每个修改后的数据帧提供相同的预测。这在线性模型的理论中是显而易见的,因为每个协变量都以相同的因子变化。