【问题标题】:How to calculate stats for one column against another column in a data frame?如何计算数据框中一列与另一列的统计信息?
【发布时间】:2021-04-10 21:46:36
【问题描述】:

我有一个数据框,其中包含“年龄”(int)和“性别”列,这是一个因素。

我将如何分别计算每个性别(男性和女性)的年龄列的中位数、平均值、分位数(probs=0.25)和分位数(probs=0.75)?

谢谢!

【问题讨论】:

    标签: r


    【解决方案1】:

    你可以使用aggregate:

    aggregate(Age ~ Gender, data, summary)
      Gender Age.Min. Age.1st Qu. Age.Median Age.Mean Age.3rd Qu. Age.Max.
    1 Female 21.00000    32.00000   43.00000 50.55556    69.00000 97.00000
    2   Male  3.00000    26.00000   70.00000 55.72727    78.50000 95.00000
    

    如果您不喜欢summary 功能,还有很多其他选择。

    样本数据:

    data <- data.frame( Age = sample(1:100,20, replace = TRUE), Gender = sample(factor(c("Female","Male")),20, replace = TRUE))
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-04-09
      • 2021-09-24
      • 2020-02-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-07-11
      相关资源
      最近更新 更多