【问题标题】:Remove strings of mixed letters and numbers删除混合字母和数字的字符串
【发布时间】:2016-01-11 09:57:20
【问题描述】:

我有一个数据框,其中有一列包含字符串。我想删除所有包含字母和数字混合的“单词”(例如“T6YUIFG8”、“898CC”......这些“单词”的长度为三个字符或更多)。它们只使用大写字母,其他方面不受限制,并且不遵循任何其他规则。如何在 R 中使用 gsub 删除它们而不使用周围的文本?

谢谢

【问题讨论】:

  • 您尝试过什么了吗?请分享你到目前为止的想法。此外,示例输入文本会有所帮助。
  • @Neijwiert:不,它不会起作用,因为它会删除像NASA 这样的词。
  • 还没有提出任何明智的建议,因为我不知道如何指定这些代码的“随机性”!还在努力……
  • 他们被其他东西包围了吗?喜欢SomeParameter=VALUE
  • 也许这个吧。假设第二组总是数字:[A-Z0-9]{8} [0-9]{4} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{12} 否则[A-Z0-9]{8} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{12}

标签: regex gsub


【解决方案1】:

假设第二组只包含数字使用:

[A-Z0-9]{8} [0-9]{4} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{12}

否则:

[A-Z0-9]{8} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{12}

【讨论】:

    猜你喜欢
    • 2016-12-06
    • 1970-01-01
    • 2014-10-12
    • 1970-01-01
    • 2017-09-06
    • 2021-03-15
    • 1970-01-01
    • 2018-08-14
    • 1970-01-01
    相关资源
    最近更新 更多