【发布时间】:2016-01-11 09:57:20
【问题描述】:
我有一个数据框,其中有一列包含字符串。我想删除所有包含字母和数字混合的“单词”(例如“T6YUIFG8”、“898CC”......这些“单词”的长度为三个字符或更多)。它们只使用大写字母,其他方面不受限制,并且不遵循任何其他规则。如何在 R 中使用 gsub 删除它们而不使用周围的文本?
谢谢
【问题讨论】:
-
您尝试过什么了吗?请分享你到目前为止的想法。此外,示例输入文本会有所帮助。
-
@Neijwiert:不,它不会起作用,因为它会删除像
NASA这样的词。 -
还没有提出任何明智的建议,因为我不知道如何指定这些代码的“随机性”!还在努力……
-
他们被其他东西包围了吗?喜欢
SomeParameter=VALUE -
也许这个吧。假设第二组总是数字:
[A-Z0-9]{8} [0-9]{4} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{12}否则[A-Z0-9]{8} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{4} [A-Z0-9]{12}