【发布时间】:2017-08-15 21:59:21
【问题描述】:
我一直在到处寻找答案,但似乎找不到任何东西:
我每隔几分钟就会对 MySQL 数据库进行一次批量更新,使用 Python 处理 ETL 工作(我正在将数据从 Web API 提取到 MySQL 系统中)。
我试图通过使用多线程或多处理同时进行多个连接和数据插入来了解我会看到什么样的潜在影响(无论是正面的还是负面的)。每个工作人员(无论是线程还是进程)都将更新与任何其他工作人员不同的表。
目前我只更新了六个表,每个表有几千条记录,但这需要扩展到几十个表和数十万条记录。
我可以找到的所有其他资源都针对同一个表进行多线程/处理,而不是每个工作人员的不同表。我的印象是我肯定想使用多线程/处理,但似乎每个人都在解决单表用例。
想法?
【问题讨论】:
标签: python mysql python-multiprocessing python-multithreading