【发布时间】:2014-08-06 18:41:54
【问题描述】:
我正在尝试用单个标记替换大量文档中的所有 URL,但是我正在执行的正则表达式似乎不起作用
s/www\.[a-z|0-9]*[.a-z]*/urltoken/g
这将匹配 www.example.com 或 www.example.com.co。但是,如果在那之后还有其他字符或单词的组合,例如 www.foo.bar?q=lol 或 www.regexr.com/index.html?q=bar。在验证 url 的第一部分后,我想适合任何字符组合,即 www.example.com.co_(这些字符在这里)_,但是在遇到单个空格之前。什么样的正则表达式可以适合 sed?
【问题讨论】: