【问题标题】:Regular expressions in Java for HTML text formatting [duplicate]Java中用于HTML文本格式的正则表达式[重复]
【发布时间】:2015-02-10 12:24:05
【问题描述】:

我需要为 HTML 文本块编写正则表达式。是什么让我感到不安,如何以一种检查开始标签是否与结束标签相同的方式进行操作?我现在拥有的是:

"^(<b>*<i>*<u>*).*(</b>*</i>*</u>)$"

我还希望能够输入具有多种格式的文本(例如粗体和斜体)。提前致谢。

【问题讨论】:

  • 正则表达式不适合您正在尝试做的工作。寻找专门用于解析 HTML 的库。
  • 你在找jsoup.org
  • 但我需要将其作为实验室练习,特别是。
  • 试着回答我的问题 ;)

标签: java html regex tags


【解决方案1】:

请注意 HTML Parser 是执行此任务的正确方法。但是如果你想匹配一些开始和结束标签,那么你可以在java中实现它(用你的标签替换Foo)

<Foo\\b[^>]*>(.*?)</Foo>

Demo

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-04-05
    • 2012-02-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多