【问题标题】:Divide column of data by mean of the group按组划分数据列
【发布时间】:2016-04-20 14:51:48
【问题描述】:

如果我有一个数据框,比如:

group=rep(1:4,each=10)
data=c(seq(1,10,1),seq(5,50,5),seq(20,11,-1),seq(0.3,3,0.3))
DF=data.frame(group,data)

现在,我想将每个 data 元素除以其组的平均值。例如:

group=rep(1:4,each=10)
data=c(seq(1,10,1),seq(5,50,5),seq(20,11,-1),seq(0.3,3,0.3))
DF=data.frame(group,data)
aggregate(DF,by=list(DF$group),FUN=mean)

#Group.1 group  data
#1       1     1  5.50
#2       2     2 27.50
#3       3     3 15.50
#4       4     4  1.65

data1=c(seq(1,10,1)/5.5,seq(5,50,5)/27.5,seq(20,11,-1)/15.5,seq(0.3,3,0.3)/1.65)
DF1=data.frame(group, data1)

但是,这有点令人费解,并且在大型数据集中工作并不容易。我觉得有一个apply 应用程序可以在这里使用,但我找不到一个好的方法。

【问题讨论】:

  • DF$newdata = DF$data / ave(DF$data, DF$group, FUN = mean) ?
  • 我不知道ave。谢谢!
  • 注意meanFUN=的默认值。

标签: r aggregate grouping mean summary


【解决方案1】:

这是常用的一组选项(感谢@G.Grothendieck 简化了ave):

# base R 
DF$newdata = ave(DF$data, DF$group, FUN = function(x) x/mean(x))
# or...
DF$newdata = DF$data / ave(DF$data, DF$group)

# dplyr
library(dplyr)
DF %>% group_by(group) %>% mutate(newdata = data/mean(data))

# data.table
library(data.table)
setDT(DF)[, newdata := data/mean(data), by=group]

【讨论】:

    猜你喜欢
    • 2023-03-08
    • 1970-01-01
    • 1970-01-01
    • 2012-07-19
    • 2014-01-31
    • 2020-03-01
    • 1970-01-01
    • 1970-01-01
    • 2016-11-04
    相关资源
    最近更新 更多