【发布时间】:2019-01-24 10:45:03
【问题描述】:
Dask 没有像 pandas 那样的 df.to_sql() ,所以我试图复制该功能并使用 map_partitions 方法创建一个 sql 表。这是我的代码:
import dask.dataframe as dd
import pandas as pd
import sqlalchemy_utils as sqla_utils
db_url = 'my_db_url_connection'
conn = sqla.create_engine(db_url)
ddf = dd.read_csv('data/prod.csv')
meta=dict(ddf.dtypes)
ddf.map_partitions(lambda df: df.to_sql('table_name', db_url, if_exists='append',index=True), ddf, meta=meta)
这将返回我的 dask 数据框对象,但是当我查看我的 psql 服务器时,没有新表...这里出了什么问题?
更新 仍然无法使其正常工作,但由于独立问题。追问:duplicate key value violates unique constraint - postgres error when trying to create sql table from dask dataframe
【问题讨论】:
标签: python postgresql pandas dask pandas-to-sql