【问题标题】:Remove unnecessary symbols in the data in R删除R中数据中不必要的符号
【发布时间】:2018-03-18 13:39:02
【问题描述】:

这是我的数据集

1.abc
2.def
3.2354
4.. $.?,

我怎样才能删除那些只有数字的obs,只有像点,逗号这样的符号......好吧,其中任何符号和数字(1#5??%)。以及文本中的单词少两个字母以上

【问题讨论】:

  • 试试df1$v1[nchar(gsub("[^[:alpha:]]+", "", df1$v1))>2]stringr::str_count(df1$v1, "[a-z]")> 2

标签: r dataframe gsub


【解决方案1】:

我们可以使用str_count 来统计字符数和子集

library(stringr)
library(dplyr)
df1 %>%
    filter(str_count(v1, "[[:alpha:]]") > 2)

或用gsub 删除任何不是字母的字符,并用nchar 计算字符数以创建子集的逻辑索引

subset(df1, nchar(gsub("[^[:alpha:]]+", "", v1))>2)
#    v1
#1 1.abc
#2 2.def

数据

df1 <- structure(list(v1 = c("1.abc", "2.def", "3.2354", "4.. $.?,")), 
.Names = "v1", class = "data.frame", row.names = c(NA, -4L))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-10-06
    • 2015-10-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-12-16
    • 2023-02-02
    相关资源
    最近更新 更多