【发布时间】:2021-06-15 14:30:54
【问题描述】:
我有一个数据集,其中包含 2 年内美国四个州的 HIV 病例的绝对数量。
在我的数据集中,有三列 date(2018 年 1 月、2018 年 2 月 ...)、state(加利福尼亚州、纽约州、佛罗里达州、马萨诸塞州)和 abs_cases。我忽略了人口随时间的变化。我现在想使用人口计算每个州的相对病例数。以下是一些人口数据示例
pop<- c("CA"= 11111, "NY"= 22222, "FL"= 33333,"MA"= 444444)。
我已经尝试过使用
df%>%
group_by(state)%>%
summarize(rel_cases= state/pop)
但它将每个州多次划分为不同的人口。
如何仅将这些值从例如 FL 中除以佛罗里达州的人口等等?
【问题讨论】:
-
欢迎来到 StackOverflow!请阅读有关how to ask a good question 的信息以及如何提供reproducible example。这将使其他人更容易帮助您。
标签: r dplyr data-manipulation data-wrangling