【发布时间】:2021-10-21 01:40:36
【问题描述】:
重要列数据库:
| script_id | date_time |
|---|---|
| 1 | 2019-01-11 09:35:00 |
| 1 | 2019-01-11 09:40:00 |
| 1 | 2019-01-11 09:45:00 |
| 2 | 2019-01-11 09:35:00 |
| 2 | 2019-01-11 09:40:00 |
| 2 | 2019-01-11 09:45:00 |
像这样我有 900K+ 行(19 年 1 月 1 日至 21 年 6 月 30 日)
我只有 200 个唯一的 script_id,所以每个 date_time 也会重复 200 次。
全列数据库:
现在,我尝试执行以下代码
df = pd.DataFrame(db_fetchquery("SELECT script_id,date_time,open,high,low,close,volume FROM data_five_minutes WHERE date_time >= '2019-01-11 09:35:00' and date_time <= '2019-01-11 09:50:00' ORDER BY id"))
df.columns = ['script_id','date_time','open','high','low','close','volume']
print(df)
这给了我大约 143 秒的结果
如何更快地获取数据(至少在 30 秒内)
【问题讨论】:
-
您能否减少从数据库请求的数据量?
标签: python sql python-3.x pandas postgresql