【发布时间】:2019-06-04 00:21:25
【问题描述】:
我想将 excel 文件中的某些列读入数据框,但是我想用列标题名称指定列。
例如,我有一个 Excel 文件,在工作表 2 中有两列:A 列中的“数字”和 B 列中的“ForeignKey”)。我想将“ForeignKey”导入数据框。我使用以下脚本做到了这一点:
xl_file = pd.read_excel('D:/SnapPython/TestDF.xlsx', sheet_name='Sheet 2', usecols=[0,1])
它在我的 xl_file 中显示以下内容:
number ForeignKey
0 1 abc
1 2 def
2 3 ghi
如果列数较少,我可以通过指定usecols=[1]来获取“ForeignKey”。但是,如果我有很多列并且知道列名模式,则通过指定列名会更容易。我尝试了以下代码,但它给出了空数据框。
xl_file = pd.read_excel('D:/SnapPython/TestDF.xlsx', sheet_name='Sheet 2', usecols=['ForeignKey'])
根据以下链接中的讨论,上面的代码运行良好,但适用于read_csv。
[How to drop a specific column of csv file while reading it using pandas?
有没有办法读取excel文件?
提前谢谢你
【问题讨论】: