【发布时间】:2021-04-21 18:12:09
【问题描述】:
我有一个 one_hot_encoded 的调查数据,然后我将其塑造成更长的数据,以便我可以比较组内的变量。这里的问题是,这在我的 n 中创造了一个“神奇的”增长。我在我的数据框中保留了一个 id 列,因此我可以使用 uniq(id) 轻松获得真实的 n 来查找提供数据的不同人员的数量。
但是,表中给出的 N 是基于行数的。有没有办法改变函数,以便 tbl_summary() 根据 uniq id 给出 N?但是,在调用 tbl_summary 之前我一直在删除 id 列以避免获取汇总统计信息。
我一直想知道的其他问题是,也许有更好的方法来塑造我的数据以使其与 gtsummary 配对?
drug1_dose = rnorm(100)
drug2_dose = rnorm(100)
df <- data.frame(drug1_dose, drug2_dose) %>%
rowid_to_column(d, "id") %>%
df <- df %>%
rename(drug1 = drug1_dose) %>%
rename(drug2 = drug2_dose) %>%
pivot_longer(c(drug1, drug2), names_to = "drug", values_to = "dose", values_drop_na = TRUE) %>%
select(-id) %>%
tbl_summary()
值得一提的是,在我的数据中,有几种情况只有药物 1 或药物 2 的数据,因为这两个组重叠但不相同。我不知道如何在 reprex 中显示它。
提前谢谢你!
【问题讨论】:
-
代替
select(-id)做group_by(id)