【问题标题】:Pandas read_excel: only read first few linesPandas read_excel:只读取前几行
【发布时间】:2017-06-09 12:49:59
【问题描述】:

在大约 100 个 excel 文件上使用 pandas read_excel - 有些很大 - 我想读取每个文件的前几行(标题和前几行数据)。

这不起作用,但说明了目标(例如读取 10 个数据行):

workbook_dataframe = pd.read_excel(workbook_filename, nrows = 10)

这是我目前的解决方法:

workbook_dataframe = pd.read_excel(workbook_filename).head(10)

解决方法的问题是它必须在获取头部之前读取整个 excel 文件。我也尝试过使用 skiprows 和 skip_footer,给它负数只会产生错误。

【问题讨论】:

  • 您是否愿意使用其他库,例如openpyxl
  • 我看了一眼 - 有没有办法根据问题部分读取 excel 文件?
  • 是的。优化的read-only 模式允许这样做。
  • 好的 - 找到了这个 - 但不是如何指定要加载的行数:wb = load_workbook(filename='large_file.xlsx', read_only=True)
  • @Aetos 似乎这个特定页面不再可用。但是,openpyxl 仍然存在。

标签: pandas


【解决方案1】:

目前不支持此功能,尽管查看代码看起来应该不会太难。你可以在https://github.com/pandas-dev/pandas/issues 的 Github 项目页面上打开一个问题。

【讨论】:

  • 已打开问题 #16645
猜你喜欢
  • 1970-01-01
  • 2021-05-08
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-10-21
  • 1970-01-01
相关资源
最近更新 更多