【发布时间】:2021-11-26 16:08:20
【问题描述】:
我想从一个非常大的数据库中删除重复的行,这些行由名称中的点定义(例如 531.1、531.2、531.3)。 例如,我应该删除前 3 行,但保留其中一个名称为 531,因此对于由近 14000 行组成的数据库而言
这是一个可重现的例子:
cell_id <- c("531.1", "531.2","531.3", "535.1","535.2","540")
value <- c(1,1,1,8,8,15)
df <-data.frame(cell_id, value)
cell_id value
1 531.1 1
2 531.2 1
3 531.3 1
4 535.1 8
5 535.2 8
6 540 15
【问题讨论】:
-
Row.Names是作为列存储在数据中还是作为行名存储?请分享您的数据的最小可重复示例:stackoverflow.com/help/minimal-reproducible-example -
对,对不起!我猜对了
-
这能回答你的问题吗? Filter rows which contain a certain string
标签: r dataframe subset rowname