【发布时间】:2022-01-01 03:20:55
【问题描述】:
我在 Hive 中有两个表(arch 和 noarch),结构如下:
| Table1Arch | Table2NoArch |
|---|---|
| tr_id | tr_id |
| res_id | res_id |
| info_json | info_json |
| created_at | |
| updated_at |
我需要获取完整的数据视图arch + noarch 并通过res_id 加入他们。
我尝试对左连接进行不同的变体,但要么从arch 得到结果,要么从noarch 得到任何结果,反之亦然。我想我应该使用union all,但很难正确编写它。
您能帮我正确查询吗?
编辑:
当我搜索特定的res_ids 时,我想获得这两个表的统一视图。
假设我有以下数据:
| Entry1Arch | Entry2Arch |
|---|---|
| 1 | 2 |
| 111 | 222 |
| {"something 1"} | {"something 2"} |
| Entry3NoArch | Entry4NoArch |
|---|---|
| 3 | 4 |
| 333 | 444 |
| {"something 3"} | {"something 4"} |
| 2021-10-03 21:01:44.0 | 2021-10-04 21:02:43.0 |
| 2021-10-03 21:01:44.0 | 2021-10-04 21:02:43.0 |
最终目标是从两个表中获取完整数据:111 + 222 + 333 + 444)。
【问题讨论】:
-
你需要什么结果?请提供两个表格中的输入数据示例和预期结果
-
@leftjoin 已更新,如果有帮助请告诉我
-
如果两个表包含相同的 res_id 怎么办?
-
啊,谢谢,我的错。那么查询不正确。我基本上想要这两个表的并集