【问题标题】:Transforming the two categorical variables into summary proportion data将两个分类变量转换为汇总比例数据
【发布时间】:2014-01-18 20:59:24
【问题描述】:

在 R 中,

什么是最有效的方法:

   gender soda
1       f    y
2       f    y
3       f    n
4       m    n
5       f    y
6       m    n
7       m    n
8       f    y
9       m    y
10      m    n

         y   n
m       0.2 0.8
f       0.8 0.2

我使用以下命令:

> tmp<-ddply(subdata,.(gender), summarise, y=length(soda[soda=="y"])/length(soda),n=length(soda[soda=="n"])/length(soda))
> rownames(tmp)<-tmp$gender
> tmp$gender<-NULL
> tmp
    y   n
f 0.8 0.2
m 0.2 0.8

但我觉得肯定有更多我不知道的惯用表达。有吗?

【问题讨论】:

    标签: r plyr summary


    【解决方案1】:

    您可以使用tableprop.table

    > prop.table(table(subdata), 2)
    
          soda
    gender   n   y
         f 0.2 0.8
         m 0.8 0.2
    

    函数table 计算每个组合的值。 prop.table 计算沿第二个边距的相对频率(即 2: 列)。

    【讨论】:

      猜你喜欢
      • 2022-01-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-10-22
      • 2023-01-12
      • 2017-01-11
      • 2016-04-07
      相关资源
      最近更新 更多