【发布时间】:2023-03-30 15:30:01
【问题描述】:
我有一个使用 Python 的 Scrapy 项目。我从网站上提取了我想要的所有数据。但我想将新数据从网站拉到现有表中,而不是在每次更新时从一开始就拉数据。例如,
+---------------------------+
| ID | Name | Job |
+---------------------------+
| 01 | Maria | Doctor |
+---------------------------+
| 02 | Silvia | Teacher |
+---------------------------+
| 03 | Lora | Soldier |
+---------------------------+
随着新的更新,新数据已添加到网站。这个数据是:
+-------------------------+
| ID | Name | Job |
+-------------------------+
| 04 | Blanca | Engineer |
+-------------------------+
所以,当我运行我的代码时,我只想将新数据从网站拉到现有表中。不是从头再来。
我该怎么做?
【问题讨论】:
-
这听起来像
INSERT。 -
实际上不是。是的,我使用 INSERT 来提取所有数据。但是我不想每次运行代码时都从头开始提取所有数据。我只想在运行代码时将新数据拉入我的存在表中。所以, INSERT 是不够的。您对这个问题有其他看法吗? @GordonLinoff
标签: python mysql sql scrapy web-crawler