【发布时间】:2019-11-20 01:08:24
【问题描述】:
我正在为我的统计计算课程做一个项目,我正在努力解决这个问题。我有一个数据集,其中包括患者 ID、访问次数(每个患者的基线、wk1、wk2)和代表不同药物的 10 个变量(下面的快照中显示的 UDS 变量)。每个“1”代表一个阳性药物筛选。我必须清理数据集以仅包含患者 ID 和阳性药物筛查的数量。 Dataset snapshot。我必须对每位患者的所有患者就诊进行分组,以便所有数据都在一行中,然后我必须对每位患者的每个药物筛选列的所有值求和,以获得将作为新列添加的最终值。
我应该提一下,我对 R 比较陌生,所以我正在尽我所能精通这门语言。
我希望这是有道理的,对于任何混淆,我深表歉意。谢谢你的帮助。我还附上了干净数据集应该是什么样子的快照。 Clean data.
我试过了:
summary_urine_df <- Clean_urine_df %>%
group_by(PATDEID, VISIT) %>%
summarize(UDS005 = sum(UDS005), UDS006 = sum(UDS006), UDS007 = sum(UDS007),
UDS008 = sum(UDS008), UDS009 = sum(UDS009), UDS010 = sum(UDS010),
UDS011 = sum(UDS011), UDS012 = sum(UDS012), UDS013 = sum(UDS013),
UDS014 = sum(UDS014))
Cleaner_urine_df <- summary_urine_df %>% mutate(
nPosScreen = UDS005 + UDS006 + UDS007 + UDS008
+ UDS009 + UDS010 + UDS011 + UDS012 + UDS013 + UDS014) %>%
mutate(nPosScreens = as.numeric(nPosScreen)) %>%
select(PATDEID, nPosScreens)
【问题讨论】:
-
请不要发布图片来分享数据,请改用
dput。请阅读有关how to ask a good question 的信息以及如何提供reproducible example。这将使其他人更容易帮助您。 -
到目前为止你有什么尝试?
-
我尝试过将 group_by() 与 summarise() 一起使用,也尝试过 rowSum() 和 mutate()。
-
使用适当的格式在问题中包含您尝试过的内容。切勿在评论中包含重要信息
-
感谢您对我的帖子提供的所有有用反馈。
标签: r statistics