【发布时间】:2019-02-14 19:36:57
【问题描述】:
我们的任务是创建最佳回归模型,其中一个问题是计算变量之间的相关性。如果我有 10 个使用 R 的解释变量,我该怎么做。
谢谢
【问题讨论】:
-
cor(df)。如果你表明你已经努力自己解决这个问题,并且特别指出任何没有按你预期工作的地方,那么这个问题更有可能得到有用的答案。
标签: r regression
我们的任务是创建最佳回归模型,其中一个问题是计算变量之间的相关性。如果我有 10 个使用 R 的解释变量,我该怎么做。
谢谢
【问题讨论】:
cor(df)。如果你表明你已经努力自己解决这个问题,并且特别指出任何没有按你预期工作的地方,那么这个问题更有可能得到有用的答案。
标签: r regression
欢迎来到论坛。短暂访问帮助中心,了解如何询问good question。下次您应该提供一个示例数据集,例如:
df = data.frame(matrix(rnorm(20), nrow=5))
您可以使用cor() 轻松找到这些变量之间的相关性:
cor(df)
您可以像这样使用corrplot() 可视化关系:
corrplot(cor(df), type = "upper", tl.srt = 45)
这是一个简单的复制和粘贴的全部内容:
#install.packages("corrplot")
library("corrplot")
df = data.frame(matrix(rnorm(20), nrow=5))
df_cor <- data.frame(cor(df))
corrplot(cor(df), type = "upper", tl.srt = 45)
您只需在第一次运行第一行。
【讨论】: