【发布时间】:2018-05-28 21:23:28
【问题描述】:
我想“合并”两个 CSV 文件。我想映射文件 1 中的电子邮件并从文件 2 中获取它们各自的用户 ID,然后我想将其分配给文件 1 的相应电子邮件
例子:
文件 1
name, userId, email
john, null, john@a.com
alex, null, alex@a.com
micheal, null, mike@a.com
alex, null, alex@a.com
john, null, john@a.com
文件 2
name, userId, email
alex, 5, alex@a.com
micheal, 10, mike@a.com
john, 12, john@a.com
输出文件
name, userId, email
john, 12, john@a.com
alex, 5, alex@a.com
micheal, 10, mike@a.com
alex, 5, alex@a.com
john, 12, john@a.com
这是我的代码,但这并没有分配相应电子邮件的 userId,因为电子邮件没有排序
import pandas as pd
df1 = pd.read_csv("file1.csv", sep=",")
df2 = pd.read_csv("file2.csv", sep=",", index_col=0)
df1["userId"] = df2["userId"].values
df1.to_csv("output.csv", sep=";")
谁能帮帮我?
【问题讨论】:
-
Dataframe.join 是您要查找的内容:pandas.pydata.org/pandas-docs/stable/generated/…
标签: python pandas csv dictionary