【问题标题】:Convert XML to JSON while retaining html tags将 XML 转换为 JSON,同时保留 html 标签
【发布时间】:2021-12-21 22:11:22
【问题描述】:

我有 XML 文档需要按照下面的代码 sn-p 使用 org.json 转换为 JSON。但是这种方法的问题是它不会在原始 XML 中保留 HTML 标记,例如 XML 文本 <abstract>the max power density was 582.4 mW/m<sup>2</sup>. After temperature decreasing</abstract> 映射到

"abstract":"the max power density was 582.4 mW/m. After temperature decreasing"。知道如何保留 HTML 标签吗?

try(FileWriter out = new FileWriter(new File("json.json")))
        {
            JSONObject json = XML.toJSONObject(new StringReader(xmlRec));
            String jsonString = json.toString(4);
            System.out.println("JSON str:  " + jsonString);
            out.write(jsonString);
        }
        catch(FileNotFoundException ex)
        {
            ex.printStackTrace();
        }
        catch(Exception e)
        {
            e.printStackTrace();
        }

【问题讨论】:

  • 我看不出 json 解析器会删除任何 xml/html 标签的任何原因,对于 org.json 这只是另一个String。你确定它会被删除吗?
  • 由于 HTML 标签是 XML 标签的一个子集,所以这不是一件容易的事。您必须识别出您希望保持不变的每个标签,然后以您可以恢复的方式操作它们,同时仍然是有效的 XML
  • xmlRec 是什么?您的代码 sn-p 似乎不完整
  • 是的,我确信它会删除 HTML 标记。我在XML中有抽象值“最大功率密度为582.4 mW/m2。温度降低到4°C后”转换为JSON后,它被转换为“最大功率密度为582.4 mW/m . 降温至4℃后"

标签: java xml-to-json


【解决方案1】:

下面是神奇的 XML 到 JSON 代码:

// Changes XML to JSON
function xmlToJson(xml) {
    
    // Create the return object
    var obj = {};

    if (xml.nodeType == 1) { // element
        // do attributes
        if (xml.attributes.length > 0) {
        obj["@attributes"] = {};
            for (var j = 0; j < xml.attributes.length; j++) {
                var attribute = xml.attributes.item(j);
                obj["@attributes"][attribute.nodeName] = attribute.nodeValue;
            }
        }
    } else if (xml.nodeType == 3) { // text
        obj = xml.nodeValue;
    }

    // do children
    if (xml.hasChildNodes()) {
        for(var i = 0; i < xml.childNodes.length; i++) {
            var item = xml.childNodes.item(i);
            var nodeName = item.nodeName;
            if (typeof(obj[nodeName]) == "undefined") {
                obj[nodeName] = xmlToJson(item);
            } else {
                if (typeof(obj[nodeName].push) == "undefined") {
                    var old = obj[nodeName];
                    obj[nodeName] = [];
                    obj[nodeName].push(old);
                }
                obj[nodeName].push(xmlToJson(item));
            }
        }
    }
    return obj;
};

我需要实现的主要更改是使用 attributes.item(j) 而不是我发现的大多数脚本使用的 attributes[j]。使用这个函数,XML 看起来像:

<ALEXA VER="0.9" URL="davidwalsh.name/" HOME="0" AID="=">
    <SD TITLE="A" FLAGS="" HOST="davidwalsh.name">
        <TITLE TEXT="David Walsh Blog :: PHP, MySQL, CSS, Javascript, MooTools, and Everything Else"/>
        <LINKSIN NUM="1102"/>
        <SPEED TEXT="1421" PCT="51"/>
    </SD>
    <SD>
        <POPULARITY URL="davidwalsh.name/" TEXT="7131"/>
        <REACH RANK="5952"/>
        <RANK DELTA="-1648"/>
    </SD>
</ALEXA>

...成为具有以下结构的 JavaScript 对象:

{
    "@attributes": {
        AID: "=",
        HOME:  0,
        URL: "davidwalsh.name/",
        VER: "0.9",
    },
    SD = [
        {
            "@attributes": {
                FLAGS: "",
                HOST: "davidwalsh.name",
                TITLE: A
            },
            LINKSIN: {
                "@attributes": {
                    NUM: 1102
                }
            },
            SPEED: {
                "@attributes": {
                    PCT: 51,
                    TEXT: 1421
                }
            },
            TITLE: {
                "@attributes": {
                    TEXT: "David Walsh Blog :: PHP, MySQL, CSS, Javascript, MooTools, and Everything Else",
                }
            },
        },
        {
            POPULARITY: {
                "@attributes": {
                    TEXT: 7131,
                    URL: "davidwalsh.name/"
                }
            },
            RANK: {
                "@attributes": {
                    DELTA: "-1648"
                }
            },
            REACH: {
                "@attributes": {
                    RANK = 5952
                }
            }
        }
    ]
}

您可以在此处使用您认为合适的 JavaScript 对象。如果您想要字符串 JSON 格式的 JavaScript,您可以编写代码:

// 假设 xmlDoc 是 XML DOM 文档

var jsonText = JSON.stringify(xmlToJson(xmlDoc));

这个函数非常有用,可以让我快速忽略 XML 并改用 JSON。该函数在构建嵌套子节点的属性和数组时效果很好。随身携带;在某些时候您可能需要将 XML 转换为 JSON!

【讨论】:

  • 很好的解释 Abdul Momen,java 中是否有任何类似的 lib 与 javascript 做同样的事情?我对 js 做的不多!
  • sn-p Abdul 提供的代码通过解析XML 中的每个元素,对于理解将XML 转换为JSON 的逻辑非常有帮助。是否有类似的代码但在 Java 中?像谷歌 gson 这样的任何其他第 3 部分库是否这样做?我需要重写序列化吗?
猜你喜欢
  • 1970-01-01
  • 2013-04-21
  • 2011-11-03
  • 2018-07-23
  • 1970-01-01
  • 2015-04-29
  • 2022-06-17
  • 2016-10-26
  • 2016-07-19
相关资源
最近更新 更多