【发布时间】:2015-11-15 13:22:49
【问题描述】:
我正在尝试在如下所示的 JSON 文件上使用 Apache Drill(第一次):
{
"Key1": {
"htmltags": "<htmltag attr1='bravo' /><htmltag attr2='delta' /><htmltag attr3='charlie' />"
},
"Key2": {
"htmltags": "<htmltag attr1='kilo' /><htmltag attr2='lima' /><htmltag attr3='mike' />"
},
"Key3": {
"htmltags": "<htmltag attr1='november' /><htmltag attr2='foxtrot' /><htmltag attr3='sierra' />"
}
}
我最初的查询是钻孔的 hello world:SELECT * FROM DataFile.json,并返回给我列 Key1、Key2、Key3。他们只有一行,其中包含以下条目:
"<htmltag attr1='bravo' /><htmltag attr2='delta' /><htmltag attr3='charlie' />" [即只有条目Key1.htmltags]。
我有两个问题:
- 当每个键有三个不同值的条目时,为什么只返回一行?
- 使用 KVGEN/FLATTEN 函数获取上面“htmltags”中的字符串后,有没有办法进一步深入(分析和提取数据)HTML 标签?
【问题讨论】:
-
无法验证您发布的 json 或从 Drill 运行您的 hello world 查询中获得结果。请检查您在帖子中使用的 json。
-
@catpaws 这是原版的代表,抱歉我没有检查有效性。我会改正的。
-
@catpaws 已编辑,感谢您指出。
标签: html json apache-drill