【发布时间】:2018-05-29 18:18:55
【问题描述】:
我想将 Excel 工作表读入 Pandas DataFrame。但是,有合并的 Excel 单元格以及空行(完整/部分 NaN 填充),如下所示。澄清一下,John H. 已下订单购买从“保镖”到“红丸蓝调”的所有专辑。
当我将此 Excel 工作表读入 Pandas DataFrame 时,Excel 数据无法正确传输。 Pandas 将合并的单元格视为一个单元格。 DataFrame 如下所示:(注意:() 中的值是我想要的值)
请注意最后一行不包含合并单元格;它仅带有 Artist 列的值。
编辑: 我确实尝试了以下方法来向前填充 NaN 值:(Pandas: Reading Excel with merged cells)
df.index = pd.Series(df.index).fillna(method='ffill')
但是,NaN 值仍然存在。 我可以使用什么策略或方法来正确填充 DataFrame? 是否有一种 Pandas 方法可以取消合并单元格并复制相应的内容?
【问题讨论】:
-
你有什么尝试吗?你能告诉我们你的尝试吗?希望这篇文章可以提供帮助:stackoverflow.com/questions/22937650/…
-
@Vico - 不仅有帮助,而且是完全相同的问题!
-
@ Vico - 我已经尝试了链接中的解决方案,但是它不起作用。
NaN值仍然存在。
标签: python excel python-3.x pandas