【问题标题】:find and replace strings with special characters?用特殊字符查找和替换字符串?
【发布时间】:2019-10-08 22:14:39
【问题描述】:

我有一个数据框,其中包含一堆包含特殊字符的课堂课程标题。我正在尝试查找并替换它们,但它不起作用

示例
Tank Walk around - 圆形便携式洗手间水箱

db$objectName[db$objectName == "Tank Walk Around – Round Portable Restroom Tanks"] <- "Tank Walk Around - Round Portable Restroom Tanks"

我还有其他带有这些特殊字符的课程标题也存在问题

`  ’  “  „  ¢  €  ®

【问题讨论】:

  • 这是一个编码问题。如果可能,您最好返回源文件并确保它以 unicode 格式读入 R。如果失败,您可以尝试更改 R 中的编码以使其正确显示。 str &lt;- "Around – Round"; Encoding(str) &lt;- "UTF-8"; str 返回[1] "Around – Round"

标签: r


【解决方案1】:

假设您想保留所有字母数字字符,可以使用以下代码。该代码使用正则表达式来删除所有非字母数字。

str = "Tank Walk Around – Round Portable Restroom Tanks"

print(strsplit(gsub("[^[:alnum:] ]", "", str), " +")[[1]])

结果:

source('~/.active-rstudio-document')

[1]“坦克”“步行”“周围”“┓圆形”“便携式”“洗手间”“坦克”

来源:R remove non-alphanumeric symbols from a string

【讨论】:

    猜你喜欢
    • 2015-07-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-11-17
    • 2015-03-17
    相关资源
    最近更新 更多