【发布时间】:2014-07-09 09:44:05
【问题描述】:
这是一个例子:
<li><a href="link" target="_parent">1. Tips and tricks</a></li>
正则表达式:
/tips(?![^<]*>)/ig
匹配单词提示。
我想要做的是也能够匹配周围的文本,可能在另一个组中?
所以匹配可能是e.g. ["1. Tips and tricks", "Tips"].
你可以测试一下here
【问题讨论】:
-
为什么不使用 HTML 解析器而不是正则表达式?
-
您到底在寻找什么?
<a>标签之间的所有文本? -
我试图只查找文本节点,我发现使用正则表达式比遍历 DOM 容易得多。原因是我正在翻译文本的语言,因此我只需要文本信息。
标签: python regex regex-negation regex-lookarounds