【问题标题】:Remove HTML tags from string using regex, without removing '<' characters from actual text between tags使用正则表达式从字符串中删除 HTML 标签,而不从标签之间的实际文本中删除“<”字符
【发布时间】:2023-03-07 04:37:02
【问题描述】:

我知道很多人一直在询问如何通过正则表达式从字符串中删除 HTML 标记,但我无法立即找到我要查找的内容。

我找到的最接近我正在寻找的答案如下:https://stackoverflow.com/a/17668453/8417376,它建议使用&lt;(?:[^&gt;=]|='[^']*'|="[^"]*"|=[^'"][^\s&gt;]*)*&gt; 作为正则表达式模式。

不幸的是,当您有以下示例时,这不起作用:&lt;p&gt;value &lt; other value &lt;/p&gt;(在这种情况下,&lt; other value &lt;/p&gt; 被视为 HTML 标记)

有没有好的解决方案?

提前致谢!

PS:如果在 C# 中有更好的方法,请随时告诉我! :)

【问题讨论】:

    标签: c# html regex string tags


    【解决方案1】:

    试试这个:

    <(?:[^><=]|='[^']*'|="[^"]*"|=[^'"][^\s>]*)*>
    

    【讨论】:

      猜你喜欢
      • 2011-11-05
      • 1970-01-01
      • 2011-10-15
      • 1970-01-01
      • 1970-01-01
      • 2012-03-25
      • 1970-01-01
      • 2011-04-09
      • 2013-02-24
      相关资源
      最近更新 更多