【问题标题】:How to delete specific html class with content using Java Html Class如何使用 Java Html 类删除带有内容的特定 html 类
【发布时间】:2015-11-14 10:16:05
【问题描述】:

最近我正在做一个 android 项目。我正在从 wordpress api 解析数据。但详细的帖子内容是 html 格式。我必须删除 html 标签。使用 Html.fromHtml().toString() java 方法我删除了所有标签。但是有一些图片说明我必须删除。要删除标题,我必须找到标签类。那么如何使用 Html Class 删除这些内容呢?

<p class="wp-caption-text">android m marshmallow</

编辑:

使用正则表达式我解决了我的问题。

Regex 中插入您的特定 Html,您将获得您的正则表达式。

 yourHtml = yourHtml.replaceAll("Your_Regular_Expression","");
 yourHtml = Html.fromHtml(yourHtml).toString();

【问题讨论】:

    标签: java html regex


    【解决方案1】:

    如果你想得到匹配,你可以试试这个:

    <(\w+).*?class="wp-caption-text".*?>[\s\S]*?<\/\1>
    

    Regex101

    我想提一下,这不是一个完美的解决方案。正则表达式不太擅长解析 html,因为该标记语言中的结构实际上太复杂,无法 100% 被正则表达式解析。见here

    【讨论】:

    • 如何在 Html 类中使用这个表达式? [\s\S]*?
    • html.replaceAll("表达式", "") ?
    • @yeahia2508 google 是一个很棒的资源。 w3schools.com/jsref/jsref_replace.asp
    • 我知道兄弟 google 是很好的资源。我从昨天开始搜索这个问题的答案。我必须用 java 解决这个问题而不是 javascript @iismathmizard
    • 正则表达式解决了我的问题兄弟。 :) 谢谢。 @iismathwizard
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2011-03-10
    • 2012-09-22
    • 2021-10-09
    • 2021-02-15
    • 1970-01-01
    • 2017-07-23
    • 2021-06-29
    相关资源
    最近更新 更多