【发布时间】:2020-12-29 17:31:17
【问题描述】:
我已经写了这个除了查询来从 databricks 笔记本的两个 hive 表中获取记录的差异。(我试图在 mssql 中获得结果,即只有结果集的差异)
select PreqinContactID,PreqinContactName,PreqinPersonTitle,EMail,City
from preqin_7dec.PreqinContact where filename='InvestorContactPD.csv'
except
select CONTACT_ID,NAME,JOB_TITLE,EMAIL,CITY
from preqinct.InvestorContactPD where contact_id in (
select PreqinContactID from preqin_7dec.PreqinContact
where filename='InvestorContactPD.csv')
但是返回的结果集也有匹配的记录。我上面显示的记录是在结果集中但是当我根据contact_id单独检查它时它是相同的。所以我不知道为什么除了返回匹配也记录一下。
只是想知道我们如何使用 sql 在 databrick notebook 中使用 except 或任何差异查找命令。
如果源数据和目标数据相同,我不想在结果集中看到任何内容。
【问题讨论】:
标签: hive hiveql databricks azure-databricks databricks-connect