【发布时间】:2021-11-16 23:00:13
【问题描述】:
当使用 dplyr、group_by 和折叠或汇总连接字符串时,NA 值将变为字符串 "NA"。如何避免?
请参阅下面的示例:
ID <- c(1,1,2,3)
string <- c(' asfdas ', 'sdf', NA, 'NA')
df <- data.frame(ID, string)
两者,
df_conca <-df%>%
group_by(ID)%>%
summarize(string = paste(string, collapse = "; "))%>%
distinct_all()
和
df_conca <-df%>%
group_by(ID)%>%
dplyr::mutate(string = paste(string, collapse = "; "))%>%
distinct_all()
结果:
ID string
1 1 " asfdas ; sdf"
2 2 "NA"
3 3 "NA"
,但我想保留 NA 的值:
ID string
1 1 " asfdas ; sdf"
2 2 NA
3 3 "NA"
理想情况下,我希望留在 dplyr 工作流程中。
【问题讨论】:
标签: r dplyr concatenation na collapse