【发布时间】:2020-04-02 00:58:21
【问题描述】:
我正在解析 json 文件,并且我有一个属性会出现两次。所以我想删除一个属性,这样我就可以避免模棱两可的错误。这是示例 json。例如,address1 和 Address1 具有相同的值,但唯一的区别是第一个字符是大写字母。所以我想从 spark scala 中的 json 解析中删除其中一个。
{
"ID": 1,
"case": "12",
"addresses": {
"": [{
"address1": "abc",
"address2": "bkc",
"Address1": "abc",
"Address2": "bk"
}, {
"address1": "ede",
"address2": "ak",
"Address1": "ede",
"Address2": "ak"
}]
},
"FirstName": "abc",
"LastName": "cvv"
}
当我们在 spark scala 中进行 json 解析时,有人可以指导我如何删除其中一个。我需要自动化这意味着现在我们面临地址问题,并且将来一些其他属性可能是类似的问题。因此,我们可能需要为遇到类似问题的所有情况寻找解决方案,而不是对其进行硬编码。
【问题讨论】:
-
您确定这是一个有效的架构吗?数组的名称为空
""这不是 json 语法中的有效属性名称。您可以尝试使用 spark 解析给定的 json,如下所示stackoverflow.com/questions/38271611/…。 Spark 将忽略它,因为不允许使用空名称 -
嗨 Alexandros,数组名称是地址。我没有输入我收到的完整 json。我刚刚提供了示例属性,我如何接收属性名称为“address1”和“Address1”,所以我想删除其中一个。
标签: json scala apache-spark jsonparser