【发布时间】:2020-06-24 06:53:31
【问题描述】:
我正在尝试将数据集映射到具有不同标头的空白 CSV 文件,因此我实际上是在尝试将具有不同标头的 CSV 文件中的数据映射到具有不同标头数量并称为不同事物的新 CSV ,这个问题不同的原因是因为列名不一样,但也没有重叠的列。而且我不能用新的标题覆盖数据文件,因为数据文件的其他列包含不相关的数据,我确定我过于复杂了。
我已经看过这个示例代码,但是我应该如何更改它,因为这个示例使用一个通用的标头来连接数据。
a = pd.read_csv("a.csv")
b = pd.read_csv("b.csv")
#a.csv = ID TITLE
#b.csv = ID NAME
b = b.dropna(axis=1)
merged = a.merge(b, on='title')
merged.to_csv("output.csv", index=False)
样本数据
a.csv(空白格式文件,格式必须与本文件一致):
Headers: TOWN NAME LOCATION HEIGHT STAR
b.csv:
Headers: COUNTRY WEIGHT NAME AGE MEASUREMENT
Data: UK, 150lbs, John, 6, 6ft
预期的输出文件:
Headers: TOWN NAME LOCATION HEIGHT STAR
Data: (Blank) John, UK, 6ft (Blank)
【问题讨论】:
-
您可以在示例数据中添加您的预期输出吗?
-
@Datanovice 示例数据是底部,a.csv 只有标题(我需要的文件格式),b.csv 是具有不同标题的数据,我需要获取并映射到.csv,
标签: python pandas csv dataframe