【问题标题】:Getting p values for groupwise correlation using the dplyr package使用 dplyr 包获取分组相关的 p 值
【发布时间】:2017-12-21 00:13:16
【问题描述】:

我正在尝试运行数据框中某些变量之间的相关性。我有一个字符向量(组),其余的是数字。

数据框

       Group    V1     V2    V3    V4    V5
       NG      -4.5   3.5   2.4  -0.5   5.5
       NG      -5.4   5.5   5.5   1.0   2.0  
       GL       2.0   1.5   -3.5  2.0   -5.5
       GL       3.5   6.5   -2.5  1.5   -2.5
       GL       4.5   1.5   -6.5  1.0   -2.0

以下是我的代码:

     library(dplyr)
     dataframe %>%
     group_by(Group) %>%
     summarize(COR=cor(V3,V4)) 

这是我的输出:

    Group       COR
    <chr>     <dbl>
      1    GL  0.1848529
      2    NG  0.1559912

如何使用编辑此代码来获取 p 值?任何帮助,将不胜感激!我在别处看过,但没有任何效果。谢谢!!

【问题讨论】:

  • 什么的 p 值?统计检验?哪个?
  • 我的意思是我得到的相关系数(皮尔逊)的 p 值。我怎么知道它是否重要?我不知道我问的是否正确。谢谢!

标签: r dplyr correlation


【解决方案1】:

如果您想查看成对相关性,您应该尝试?corrplot

library(corrplot)
df_cor <- cor(df[,sapply(df, is.numeric)])
corrplot(df_cor, method="color", type="upper", order="hclust")

在下图中,您可以注意到“正相关”以“蓝色”显示,“负相关”以“红色”显示,其强度与相关系数成正比。

#sample data
> dput(df)
structure(list(Group = structure(c(2L, 2L, 1L, 1L, 1L), .Label = c("GL", 
"NG"), class = "factor"), V1 = c(-4.5, -5.4, 2, 3.5, 4.5), V2 = c(3.5, 
5.5, 1.5, 6.5, 1.5), V3 = c(2.4, 5.5, -3.5, -2.5, -6.5), V4 = c(-0.5, 
1, 2, 1.5, 1), V5 = c(5.5, 2, -5.5, -2.5, -2)), .Names = c("Group", 
"V1", "V2", "V3", "V4", "V5"), class = "data.frame", row.names = c(NA, 
-5L))

【讨论】:

  • @Shades 有帮助吗?也许你应该accept the answer 这样做,这样问题就可以被认为是接近了。
  • @Prem..它有帮助!接受您的回答..谢谢!
猜你喜欢
  • 2020-07-21
  • 1970-01-01
  • 2018-10-31
  • 2023-03-09
  • 1970-01-01
  • 1970-01-01
  • 2022-01-07
  • 2016-07-04
  • 1970-01-01
相关资源
最近更新 更多