【发布时间】:2022-01-25 17:02:44
【问题描述】:
我对 R 和使用 lapply 还是很陌生。我有一个大数据框,我正在尝试使用 lapply 来输出此数据框的某些子集的总和。
| group_a | group_b | n_variants_a | n_variants_b |
|---|---|---|---|
| 1 | NA | 1 | 2 |
| NA | 2 | 5 | 4 |
| 1 | 2 | 2 | 0 |
我想查看基于多个不同组(group_a、group_b)的子集并对 n_variants 的每一列求和。
仅在一组和 n_variant 集上运行它:
sum(subset(df, (!is.na(group_a)))$n_variants_a
但是,我想根据每个分组对每个 n_variant 列求和。我的 lapply 脚本为每个总和输出 0 值。
summed_variants <- lapply(list_of_groups, function(g) {
lapply(list_of_variants, function(v) {
sum(subset(df, !(is.na(g)))$v)
我想知道是否需要使用 paste0 来粘贴变体列表,但我无法让它工作。
感谢您的帮助!
【问题讨论】: