【问题标题】:Convert HTML character code to char in Java在 Java 中将 HTML 字符代码转换为 char
【发布时间】:2011-10-03 21:50:39
【问题描述】:

我们的 XML 提要在 ISO-8859-1 文件中为我们提供了编码的 UTF-8 字符。这被输入数据库。所以文本是 ISO-8859-1 编码并包含以下内容:

金融市场

有没有办法将它转换成普通的 Java 字符串?类似于:

String str = fromHtmlUtf8("金融市场");

结果 str 将包含正常的 UTF8 字符。在这种情况下是中文,但可以很杂。

谢谢。

【问题讨论】:

  • 我喜欢这个解决方案:stackoverflow.com/a/599671/1392882>

标签: java html encoding utf-8


【解决方案1】:

您可以使用来自 Apache Commons 的 StringEscapeUtils: http://commons.apache.org/lang/api-2.6/org/apache/commons/lang/StringEscapeUtils.html

下次搜索之前:How to convert from HTML to UTF-8 in java

【讨论】:

  • 伟人志同道合。我刚才确实在看同一页。谢谢!
【解决方案2】:

如果你需要小库,你可以使用 HTMLEntitles

http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=htmlentities

【讨论】:

    猜你喜欢
    • 2011-06-18
    • 1970-01-01
    • 2011-04-22
    • 2014-09-30
    • 1970-01-01
    • 2015-11-07
    • 2013-04-15
    • 1970-01-01
    • 2011-09-07
    相关资源
    最近更新 更多