【发布时间】:2015-01-26 05:52:23
【问题描述】:
以下问题:
我有一个包含多个条目的变量的数据框 data1:
data1 <- data.frame(v1 = c("test, test, bird", "bird, bird", "car"))
现在我想删除每一行中的重复条目。结果应如下所示:
data1.final <- data.frame(v1 = c("test, bird", "bird", "car"))
我试过了:
data1$ID <- 1:nrow(data1)
data1$v1 <- as.character(data1$v1)
data1 <- split(data1, data1$ID)
reduce.words <- function(x) {
d <- unlist(strsplit(x$v1, split=" "))
d <- paste(d[-which(duplicated(d))], collapse = ' ')
x$v1 <- d
return(x)
}
data1 <- lapply(data1, reduce.words)
data1 <- as.data.frame(do.call(rbind, data1))
但是,这会产生空行,第一行除外。有没有人想办法解决这个问题?
【问题讨论】:
标签: r duplicates collapse