【发布时间】:2018-11-27 04:15:27
【问题描述】:
我创建了一个类似于以下结构的表:
create table some_table (
id serial,
numbers int []
);
我想以一种有效的方式复制一个 pandas 数据帧,所以我不想使用慢速的to_sql 方法,所以,在https://stackoverflow.com/a/41876462/754176 和https://stackoverflow.com/a/29125940/754176 之后,我尝试了以下方法:
import pandas as pd
import psycopg2
# Create the connection, and the cursor (ommited)
# Function from the second link
def lst2pgarr(alist):
return '{' + ','.join(alist) + '}'
df = pd.DataFrame({'numbers': [[1,2,3], [4,5,6], [7,8,9]]})
df['numbers'] = df.numbers.apply(lambda x: lst2pgarr([str(y) for y in x]))
import io
f = io.StringIO()
df.to_csv(f, index=False, header=False, sep="|")
f.seek(0)
cursor.copy_from(f, 'some_table', columns=["numbers"], sep='|')
cursor.close()
此代码不会引发错误,但不会向表中写入任何内容。
所以,我将代码修改为
import csv
df = pd.DataFrame({'numbers': [[1,2,3], [4,5,6], [7,8,9]]})
df['numbers'] = df.numbers.apply(lambda x: lst2pgarr([str(y) for y in x]))
f = io.StringIO()
df.to_csv(f, index=False, header=False, sep="|", quoting=csv.QUOTE_ALL, quotechar="'"))
f.seek(0)
cursor.copy_from(f, 'some_table', columns=["numbers"], sep='|')
cursor.close()
此代码引发以下错误:
---------------------------------------------------------------------------
DataError Traceback (most recent call last)
<ipython-input-40-3c58c4a64abc> in <module>
----> 1 cursor.copy_from(f, 'some_table', columns=["numbers"], sep='|')
DataError: malformed array literal: "'{1,2,3}'"
DETAIL: Array value must start with "{" or dimension information.
CONTEXT: COPY some_table, line 1, column numbers: "'{1,2,3}'"
我该怎么办?
另外,知道为什么第一个代码没有抛出错误会很有趣。
【问题讨论】:
-
将引号字符更改为
"允许我成功使用来自psql的copy命令,但我仍然在python中遇到与上述相同的错误:`DataError:格式错误的数组字面量:""{1,2,3}""`
标签: python python-3.x postgresql pandas psycopg2