【发布时间】:2012-01-19 08:06:08
【问题描述】:
我得到一些格式错误的 xml 文本输入,例如:
"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>"
我想清理输入以便得到:
"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>"
也就是说,转义像 这样的特殊符号,但保留有效标签(“<Tag>something</Tag>,注意,大小写相同)
你知道有什么 java 库可以做到这一点吗?可能是 xml/html 解析器? (虽然我真的不需要解析器,简单的“干净”过程)
【问题讨论】:
-
孤儿 '>' 字符不是问题。但是你怎么知道一个特定的 'always 后跟一个不是 XML 中的
Name的数字吗? -
它们不是我的 xml 文档,也没有架构。不幸的是,我发现了一个“
标签: java html xml tags escaping