Pandas read_excel：只读取前几行答案

【问题标题】：Pandas read_excel: only read first few linesPandas read_excel：只读取前几行
【发布时间】：2017-06-09 12:49:59
【问题描述】：

在大约 100 个 excel 文件上使用 pandas read_excel - 有些很大 - 我想读取每个文件的前几行（标题和前几行数据）。

这不起作用，但说明了目标（例如读取 10 个数据行）：

workbook_dataframe = pd.read_excel(workbook_filename, nrows = 10)

这是我目前的解决方法：

workbook_dataframe = pd.read_excel(workbook_filename).head(10)

解决方法的问题是它必须在获取头部之前读取整个 excel 文件。我也尝试过使用 skiprows 和 skip_footer，给它负数只会产生错误。

【问题讨论】：

您是否愿意使用其他库，例如openpyxl？
我看了一眼 - 有没有办法根据问题部分读取 excel 文件？
是的。优化的read-only 模式允许这样做。
好的 - 找到了这个 - 但不是如何指定要加载的行数：wb = load_workbook(filename='large_file.xlsx', read_only=True)
@Aetos 似乎这个特定页面不再可用。但是，openpyxl 仍然存在。

标签： pandas

【解决方案1】：

目前不支持此功能，尽管查看代码看起来应该不会太难。你可以在https://github.com/pandas-dev/pandas/issues 的 Github 项目页面上打开一个问题。

【讨论】：