【发布时间】:2020-06-30 23:02:10
【问题描述】:
我想明白为什么将 200 万行插入 TimescaleDB/PostgreSQL 比将它们插入 mysql 需要更长的时间,因为据说 TimescaleDB 具有高插入率,高于 mysql...
使用了以下内容:
MySQL:
engine = create_engine("mysql+pymysql://root:paswd@localhost/db")
con = engine.connect()
readcsv = pd.read_csv(r"C:\2mio.csv",delimiter=',',names=['x','y'],skiprows=1 )
a=1
readcsv.insert(2,"z",a)
readcsv.to_sql(name='table',con=con,schema='db',if_exists='append',index=False)
持续时间:500 秒
PostgrSQL/TimescaleDb:
engine = create_engine("postgresql+psycopg2://postgres:paswd@127.0.0.1/postgres")
con = engine.connect()
readcsv = pd.read_csv(r"C:\2mio.csv",delimiter=',',names=['x','y'],skiprows=1)
a=1
readcsv.insert(2,"z",a)
readcsv.to_sql(name='table',con=con,schema='postgres',if_exists='append',index=False)
持续时间 870 秒
【问题讨论】:
-
谁在乎?为什么肝移植比肾移植多花 15 分钟?它们是不同的东西,它们需要不同的时间。如果差异是 10 倍,那可能真的很有趣。
标签: python mysql postgresql sql-insert timescaledb