【发布时间】:2020-10-23 19:47:40
【问题描述】:
我有一个这样的数据框(df)。我想要做的是遍历每个 ID 的值,如果有两个以相同单词开头的字符串,我想比较它们以保持不同的值。
df <- data.frame(id = c(1,1,2,3,3,4,4,4,4,5),
value = c('australia', 'australia sydney', 'brazil',
'australia', 'usa', 'australia sydney', 'australia sydney randwick', 'australia', 'australia sydney circular quay', 'australia sydney'))
我想获取第一个词来比较它们,如果它们不同,则保留两者,但如果它们相同,则转到第二个词来比较它们,依此类推...... 因此,对于 ID 1,我想保留值为“australia sydney”的行,对于 ID 4,我想保留“australia sydney circular quay”和“australia sydney randwick”。 对于此示例,我需要获取第 2:5、7、9,10 行
【问题讨论】:
-
你能纠正你的例子吗,现在它给出了一个错误。您还可以显示共享数据的预期输出吗?
-
抱歉,我修正了错误。我的预期输出是获得行 2:5, 7, 9:10