【问题标题】:Count only alphanumeric characters in a string仅计算字符串中的字母数字字符
【发布时间】:2020-03-04 17:53:45
【问题描述】:

给定字符串"This has 4 words!" 我只想计算字母和数字。我想排除空格和标点符号。因此,上面的字符串应该返回13

我不知道为什么,但我无法为 R 得到这个。

【问题讨论】:

    标签: r text tidytext


    【解决方案1】:

    我们可以在str_count 中使用[[:alnum:]] 只计算字母和数字

    library(stringr)
    str_count(str1, "[[:alnum:]]")
    #[1] 13
    

    或者在base Rgsub中去掉[[:punct:]]然后用nchar得到字符数

    nchar(gsub("[[:punct:]]+", "", str1))
    

    或否定 (^) 非字母数字字符,替换为空白 ("") 并获取 nchar

    nchar(gsub("[^[:alnum:]]+", "", str1))
    #[1] 13
    

    数据

    str1 <- "This has 4 words!"
    

    【讨论】:

    • 谢谢!那是在我的舌尖上!
    猜你喜欢
    • 2012-01-11
    • 2018-09-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-07
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多