【发布时间】:2021-04-09 01:09:06
【问题描述】:
我正在总结一个包含 7000 多个非数字值的巨大数据框。
以下是我尝试处理数据的示例。
| Person | Description | Initials | Locations |
|---|---|---|---|
| Jake | Info1 | JK | Mars |
| Jake | Info2 | JK | Jupiter |
| Sam | Info1 | SP | Saturn |
| Sam | Info2 | SP | Earth |
| Sam | Info3 | SP | Mars |
我希望我的输出是这样的:
| Person | Description | Initials | Locations |
|---|---|---|---|
| Jake | Info1 ; Info2 | JK | Mars ; Jupiter |
| Sam | Info1 ; Info2 ; Info3 | SP | Saturn ; Earth ; Mars |
我已将数据导入 R,但不太确定如何根据第一列合并所有数据。我知道我们可以在 R 中使用聚合的数字。我应该如何仅使用值/非数字信息并将它们与它们之间的分号结合起来。
我将不胜感激这方面的任何帮助。提前谢谢你。
test <- read.table(file='test_data.tsv', sep = '\t', header = TRUE, fill = TRUE)
【问题讨论】: