【发布时间】:2021-02-02 06:38:10
【问题描述】:
我有一个大约有一个数据框。 26,000 个条目。数据框有一个 ID 列,ID 用“;”分隔并且多个值列也用“;”分隔。它看起来像这样:
df <- data.frame (ID = c("sample1;sample2;sample3", "sample3", "sample3;sample4;sample5;sample6"),
value_1 = c("10;20;30", "30", "30;40;50;60"),
value_2 = c("130", "130", "130"))
问题是ID条目的数量和位置以及对应的值在一行内是恒定的,但在各行之间它们是不同的。此外,有些列(例如 value_2)中的条目应保持不变。有没有一种简单的方法可以降低数据集的复杂性?谢谢
【问题讨论】:
标签: r dplyr complexity-theory reduction