【发布时间】:2019-02-08 11:45:47
【问题描述】:
我有一个大数据框,我想导出一个新的数据框,其中包含基于 id 列的第一个汇总统计信息。
library(tidyverse)
set.seed(123)
id = rep(c(letters[1:5]), 2)
species = c("dog","dog","cat","cat","bird","bird","cat","cat","bee","bee")
study = rep("UK",10)
freq = rpois(10, lambda=12)
df1 <- data.frame(id,species, freq,study)
df1$id<-sort(df1$id)
df1
df2 <- df1 %>% group_by(id) %>%
summarise(meanFreq= mean(freq),minFreq=min(freq))
df2
我想将物种名称保留在带有摘要统计信息的新数据框中。但是如果我按 id 合并,我会得到多余的行。我应该每个 id 只有一行,但要附加物种名称。
df3<-merge(df2,df1,by = "id")
这应该是它的样子,但我的真实数据比这里整齐的设置更混乱:
df4 = df3[seq(1, nrow(df3), 2), ]
df4
【问题讨论】: