【发布时间】:2019-11-21 09:37:09
【问题描述】:
我想检查 Pandas 数据框中的哪些值不在 SQL 数据库中。所以基本上是一个左连接(左边是 pandas df),其中右(SQL DB)键是 NULL。
数据库很大,大约有 500 万个条目,但我只对主键感兴趣。
Pandas 数据帧(50k 行)比 SQL DB(5M)小得多,所以我会 而是将数据移动到提供所有数据的数据库中
我考虑过在 SQL 中创建一个临时表并进行 LEFT JOIN,但可能只需要一个查询就可以完成
熊猫数据框:
index
0
1
2
3
4
sql数据库:
index(primary key)
1
2
3
result: 0, 4
【问题讨论】:
标签: python mysql sql sql-server pandas