【发布时间】:2019-01-25 12:42:57
【问题描述】:
我需要在一个 Excel 工作簿中获取多个工作表,并根据每个工作表中的一组列值将它们合并到一个数据框中。
我有:
Sheet 1:
ID A B C
1 0 l g
2 2 e n
3 3 c h
表 2:
ID L M N
1 7 u i
2 0 o j
3 9 c k
我正在寻找: 表 3:
ID A B C L M N
1
2
3
编辑我正在处理任意数量的工作表,这使得它变得复杂。
我是 pandas/python/coding 的新手,但现在正在使用它:
import pandas as pd
import numpy as np
def get_sheets():
""" Get sheets to join"""
ask = input("Are the sheets in the same workbook?".lower())
if ask == "yes" or "y":
file = input("Please enter the filepath for the workbook")
df_lib = pd.read_excel(file, None)
merged = pd.merge(df_lib.items(), how="left" on='ID')
merged.to_csv("new_merged_data.csv")
我返回一个错误,因为我没有“正确”的数据框可以加入。但我不确定如何分解由 pd.read_excel 函数创建的数据帧库或在 pd.merge 函数中调用它们。
【问题讨论】: