【发布时间】:2018-04-07 18:38:09
【问题描述】:
以下内容只是 Coursera 数据科学作业的开始。我希望这不是微不足道的。但我迷失了这一点,找不到答案。 我被要求将 Excelfile 导入 panda 数据框并在之后对其进行操作。该文件可以在这里找到:http://unstats.un.org/unsd/environment/excel_file_tables/2013/Energy%20Indicators.xls
让我感到困难的是
a) 有 17 行的“开销”和一个页脚 b) 前两列是空的 c) 索引列没有标题名称
如果搜索和阅读几个小时后,我想出了这个无用的行:
energy=pd.read_excel('Energy Indicators.xls',
sheetname='Energy',
header=16,
skiprows=[17],
skipfooter=38,
skipcolumns=2
)
这似乎产生了一个多索引数据框。尽管命令 energy.head() 什么都不返回。
我有两个问题:
- 我做错了什么。在这个练习之前,我认为我理解了数据框。但是现在我完全一无所知并且迷失了:-((
- 我该如何解决这个问题?我需要做什么才能将此 Exceldata 放入索引包含国家/地区的数据帧中?
谢谢。
【问题讨论】:
-
我认为你需要
skiprows=17,而不是[17]。 -
对不起。如果它会那么容易,我会很高兴。不,这没有任何改变。 :-(
标签: python excel pandas dataframe import