【发布时间】:2019-05-05 07:52:27
【问题描述】:
我正在阅读网站上的 SQL 和 Pandas 的比较 http://pandas.pydata.org/pandas-docs/stable/comparison_with_sql.html。在这里,当我在做 sql inner join 时,列的名称是重复的。如何给他们起合适的名字?
import numpy as np
import pandas as pd
import sqlite3
np.random.seed(100)
# database
con = sqlite3.connect("mydb.db")
# dataframes
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value': np.random.randn(4)})
df2 = pd.DataFrame({'key': ['B', 'D', 'D', 'E'],
'value': np.random.randn(4)})
print(df1, '\n\n', df2)
# add dataframes to database
df1.to_sql('df1',con,if_exists='replace',index=False)
df1.to_sql('df2',con,if_exists='replace',index=False)
q = """
SELECT *
FROM df1
INNER JOIN df2
ON df1.key = df2.key;
"""
pd.read_sql_query(q,con)
这给了
key value key value
0 B 0.342680 B 0.981321
1 D -0.252436 D 0.221180
2 D -0.252436 D 0.514219
如何获取表格:
key df1_value df2_value
0 B 0.342680 0.981321
1 D -0.252436 0.514219
2 D -0.252436 0.221180
【问题讨论】: