【问题标题】:R: dealing with " " symbolsR:处理“”符号
【发布时间】:2021-04-09 05:49:36
【问题描述】:

我正在使用 R 编程语言。我正在从包含许多引号的网站复制文本数据,即 "" 。当我尝试创建包含此文本的数据框时,由于“”符号冲突,我会收到错误消息。

例如:

a <- " "blah" blah blah"

Error: unexpected symbol in "a <- " "blah"

通常,我会尝试使用 gsub() 函数从数据框中删除这些引号,但我什至无法创建数据框。当然,我可以把这段文字带入文字处理软件,点击“ctrl + H”,将所有引号(“”)替换为空格()。但是有没有办法在 R 本身中做到这一点?

谢谢

【问题讨论】:

    标签: r dataframe text formatting quotation-marks


    【解决方案1】:

    处理这种情况的典型方法是转义带有反斜杠的文字双引号:

    a <- " \"blah\" blah blah"
    [1] " \"blah\" blah blah"
    

    您还可以将字符串文字包含在单引号内,然后甚至不必转义双引号:

    a <- ' \"blah\" blah blah'
    [1] " \"blah\" blah blah"
    

    【讨论】:

    • 感谢您的回答!唯一的问题是,这个文本包含大约 10,000 个单词,并且有很多引号“”。在任何地方手动编写这些反斜杠对我来说效率极低。有没有办法一次性把所有东西都包起来?
    • 好吧,如果您的文本 没有 有单引号,那么只需使用我的第二个示例,它应该可以解决您的问题。如果没有,那么您可能必须先对文本进行正则表达式替换,然后再将其引入您的 R 脚本。但是...为什么不直接使用read.csv 阅读这么大的文本呢?
    • 我的文本也有单引号 :( 在您的第二个示例中,您仍然手动在双引号周围放置反斜杠?
    • 任何支持正则表达式的文本编辑器都可以在这里为您提供帮助。我只是在互联网演示中向您展示如何进行替换,仅此而已。
    猜你喜欢
    • 2015-06-27
    • 2015-08-13
    • 1970-01-01
    • 2017-11-30
    • 1970-01-01
    • 1970-01-01
    • 2014-03-02
    • 2019-02-27
    • 1970-01-01
    相关资源
    最近更新 更多