【发布时间】:2021-07-24 01:21:12
【问题描述】:
我的数据框如下,其中 gender=="1" 是指男性,gender=="2" 是指女性,职业从 A 到 U,年份从 2010 年到 2018 年(我给你一个小例子)
Gender Occupation Year
1 A 2010
1 A 2010
2 A 2010
1 B 2010
2 B 2010
1 A 2011
2 A 2011
1 C 2011
2 C 2011
我想要一个输出汇总性别、年份和职业不同的行数,如下所示:
Year | Occupation | Men | Woman
2010 | A | 2 | 1
2010 | B | 1 | 1
2011 | A | 1 | 1
2011 | C | 1 | 1
我尝试了以下方法:
Nr_gender_occupation <- data %>%
group_by(year, occupation) %>%
summarise(
Men = aggregate(gender=="1" ~ occupation, FUN= count),
Women = aggregate(gender=="2" ~ occupation, FUN=count)
)
【问题讨论】:
-
只是好奇(为了假设和可能的数据丢失),您是否关心非二进制性别值?
-
不,我只有二进制性别值。谢谢!
标签: r dataframe aggregate summarize