【发布时间】:2022-02-06 08:21:32
【问题描述】:
df 是一个测试数据框,它有 5 行 6 列,它是一个更大的数据框的子集(尺寸:1000000 X 30)。
df <- data.frame(
Hits = c("Hit1", "Hit2", "Hit3", "Hit4", "Hit5"),
category1 = c("a", "", "b", "a", ""),
category2 = c("c", "", "", "d", "c"),
category3 = c("", "", "e", "f", "f"),
category4 = c("", "", "", "", ""),
category5 = c("i", "", "i", "j", ""))
df 看起来像这样
对于从category1 到category5 的每一列,我只需要保留所有唯一元素的第一次出现。例如对于category1,唯一元素是a 和b,它们的第一次出现分别在第1 行和第3 行。所以应该保留第 1 行和第 3 行,依此类推。输出应该是这样的
【问题讨论】: