【发布时间】:2023-03-07 04:37:02
【问题描述】:
我知道很多人一直在询问如何通过正则表达式从字符串中删除 HTML 标记,但我无法立即找到我要查找的内容。
我找到的最接近我正在寻找的答案如下:https://stackoverflow.com/a/17668453/8417376,它建议使用<(?:[^>=]|='[^']*'|="[^"]*"|=[^'"][^\s>]*)*> 作为正则表达式模式。
不幸的是,当您有以下示例时,这不起作用:<p>value < other value </p>(在这种情况下,< other value </p> 被视为 HTML 标记)
有没有好的解决方案?
提前致谢!
PS:如果在 C# 中有更好的方法,请随时告诉我! :)
【问题讨论】: