【发布时间】:2021-12-21 22:11:22
【问题描述】:
我有 XML 文档需要按照下面的代码 sn-p 使用 org.json 转换为 JSON。但是这种方法的问题是它不会在原始 XML 中保留 HTML 标记,例如 XML 文本
<abstract>the max power density was 582.4 mW/m<sup>2</sup>. After temperature decreasing</abstract> 映射到
"abstract":"the max power density was 582.4 mW/m. After temperature decreasing"。知道如何保留 HTML 标签吗?
try(FileWriter out = new FileWriter(new File("json.json")))
{
JSONObject json = XML.toJSONObject(new StringReader(xmlRec));
String jsonString = json.toString(4);
System.out.println("JSON str: " + jsonString);
out.write(jsonString);
}
catch(FileNotFoundException ex)
{
ex.printStackTrace();
}
catch(Exception e)
{
e.printStackTrace();
}
【问题讨论】:
-
我看不出 json 解析器会删除任何 xml/html 标签的任何原因,对于 org.json 这只是另一个
String。你确定它会被删除吗? -
由于 HTML 标签是 XML 标签的一个子集,所以这不是一件容易的事。您必须识别出您希望保持不变的每个标签,然后以您可以恢复的方式操作它们,同时仍然是有效的 XML
-
xmlRec是什么?您的代码 sn-p 似乎不完整 -
是的,我确信它会删除 HTML 标记。我在XML中有抽象值“最大功率密度为582.4 mW/m2。温度降低到4°C后”转换为JSON后,它被转换为“最大功率密度为582.4 mW/m . 降温至4℃后"
标签: java xml-to-json