【发布时间】:2020-01-25 22:09:57
【问题描述】:
我想删除段落中的前 4 个单词
原文:Mywebsite 21 12 34 have 10000 traffic
我想要的结果:have 10000 traffic
我有 1000 行与原始段落相同(Mywebsite 21 12 34 have 10000 traffic)
我有这样的正则表达式搜索代码:
下面的代码是从句子中删除第一个单词:
^\w+\s+(.*) = replace with $1
以下代码将删除行中的所有数字:
[0-9 ]+ = replace with space
我想结合上面的代码,让一个正则表达式搜索代码按照我上面的解释工作,但不影响同一行的任何其他单词。
【问题讨论】:
-
尝试
^\w+\s[\d\s]+并用空字符串替换,re.sub(r'^\w+\s[\d\s]+', '', text) -
或者尝试删除 4 次非空白字符,后跟一个制表符或空格
^[\t ]*(?:\S+[ \t]+){4}regex101.com/r/CyUYh0/1 -
完美!!它的工作很迷人,非常感谢!
-
regex.inginf.units.it 这是构建正则表达式的好工具。
标签: python regex regex-negation regex-greedy