Ruby 正则表达式排除多个具有正面前瞻性的项目答案

【问题标题】：Ruby regular expression exclude multiple items with positive lookaheadRuby 正则表达式排除多个具有正面前瞻性的项目
【发布时间】：2019-10-28 22:08:34
【问题描述】：

我想在 Ruby 中使用正向前瞻 (?=) 时排除多个项目。

所以我们可以匹配换行符 (\n) 后跟除换行符和 block-level elements 之外的任何内容，假设我们要匹配 em 和 strong，但不匹配 ul 和 li 例如：

\nJuanito
\n<ul>\n    <li>List
\n    </li>
\n    <em>
\n <strong>\n  Fatas!

我目前有（Rubular 需要 \\n 才能获得 \n）：

\\n(?=[^\\n])

这将匹配所有换行符，如下所示：

但我只想：

无法弄清楚如何添加我想要排除的事物列表，同时排除换行符。

也对不使用正向前瞻的解决方案感兴趣。

谢谢。

【问题讨论】：

标签： regex ruby

【解决方案1】：

您维护拒绝列表并将它们合并为负前瞻：

rejects = Regexp.union %w[<ul </ul <li </li]
#⇒ /<ul|<\/ul|<li|<\/li/

input.scan(/\n(?!\n|\s*#{rejects})/)
#⇒ ["\n", "\n", "\n", "\n"]

【讨论】：