【发布时间】:2020-03-12 16:54:27
【问题描述】:
所以我有一个风格怪异的 xls 文件,但我无能为力,所以我只需要解析它。
如您所见,我有一些合并的单元格。我想要做的是填充合并单元格的空值(“填充”),但也要保持空单元格的原样。
类似的东西
EIM, C,NI1 Enescu_Ioan, EIM, S,NI11,Enescu_Ioan
EIM, C,NI1 Enescu_Ioan, Empty
EIM, C,NI1 Enescu_Ioan EIM, S,NI11,Enescu_Ioan
EIM, C,NI1,Enescu_Ioan Empty
我现在加载文件的方式是这样的。
xl = pd.ExcelFile("data/file.xls")
df = xl.parse(0, header=None)
我也尝试过像这样打开文件并访问合并的单元格,但我得到一个空列表。
book = xlrd.open_workbook("data/file.xls")
book.sheet_by_index(0).merged_cells # This is empty []
有什么办法可以做到这一点吗?谢谢!
编辑
关于这个问题可能有些混乱,所以我会尝试更好地解释。附加图像是较大文件的子集,其中列可能以不同的顺序出现。我想要实现的是一种区分合并单元格 NAN 值(在合并单元格中只有第一列有值,其余均为 nan)和空单元格 NAN 的方法。
【问题讨论】:
-
你试过 pandas read_excel 吗? pandas.pydata.org/pandas-docs/stable/reference/api/…
-
@MahendraSingh 是的,我得到相同的输出
标签: python excel python-3.x pandas