【发布时间】:2021-06-24 17:01:29
【问题描述】:
我有两个数据框(用于 excel 文件),下面的列
文件 1- 列
person_ID Test_CODE REGISTRATION_DATE subject_CD subject_DESCRIPTION subject_TYPE
文件 2- 列
person_ID Test_CODE REGISTRATION_DATE subject_Code subject_DESCRIPTION subject_Indicator
但是,subject_CD 和 subject_Code 列的含义相同。同样,subject_TYPE 和 subject_Indicator 的含义相同。所以,我想在阅读 excel 文件时重命名它们
我尝试了以下方法,但它不起作用
dfs = []
for f in files:
df = pd.read_excel(f, sep=",",low_memory=False)
print(df.columns)
df1 = df[df.columns.intersection(['person_ID','Test_CODE','REGISTRATION_DATE','subject_CD','subject_DESCRIPTION','subject_TYPE'])].rename(columns={'subject_TYPE':'subject_Indicator','subject_CD':'subject_Code'})
dfs.append(df1)
由于我想追加/合并这两个文件,我希望最终数据框中的列名如下所示
person_ID Test_CODE REGISTRATION_DATE subject_Code subject_DESCRIPTION subject_Indicator
可以帮我解决这个问题吗?
【问题讨论】:
-
请发布您的预期输出。
-
@MayankPorwal - 更新了最终数据框中预期的列名
标签: python pandas dataframe numpy rename