【发布时间】:2023-04-10 07:14:01
【问题描述】:
我想删除列中某些不必要的字符,以便将数据拆分为数组。
原始数据是这样的json格式:
{
"id":"xyz",
"listL":"[\"N09jk\",\"KLpp1\"]",
"timestamp":"2019-01-04 05:33:02",
}
我想将listL 属性解析为像[N09jk, KLpp1] 这样的数组。
但是考虑到当前格式,它将整个字符串作为一个元素,如下所示:
[["N09jk","KLpp1"]]
我想知道在解析文件然后拆分为数组时删除字符 [ , ] 和 " 是否可行。
我的创建表查询是:
CREATE EXTERNAL TABLE IF NOT EXISTS db.table (
\`id\` string,
\`listL\` array<string>,
\`timestamp\` timestamp
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
WITH SERDEPROPERTIES (
'serialization.format' = '1'
) LOCATION 's3://path/'
TBLPROPERTIES ('has_encrypted_data'='false');
【问题讨论】:
标签: sql amazon-web-services amazon-athena