使用 Omnipage 或 Abbyy Finereader 将 PDF 转换为 Excel 时，有没有办法阻止它拆分单个单元格？答案

【问题标题】：When converting PDF to Excel with Omnipage or Abbyy Finereader, is there are way to stop it from splitting individual cells?使用 Omnipage 或 Abbyy Finereader 将 PDF 转换为 Excel 时，有没有办法阻止它拆分单个单元格？
【发布时间】：2016-03-22 22:56:20
【问题描述】：

我正在尝试从 PDF 文件中提取一些表格，这两种工具（Abbyy 和 Omnipage）都可以很好地识别表格。但是在识别行和列时，它们都犯了同样的错误。

通常，当他们创建部分行时，问题就出现了，只水平拆分一个单元格，而不是其他单元格。有关我的意思的示例，请参见附图。在左侧的列中，一些单元格被分成两半，这使得表格在 Excel 中难以处理。

我觉得奇怪的是这些程序首先会这样做，因为带有拆分单元格的表格总是很痛苦。

有没有办法告诉这些程序只设置完整的列和行，而不是拆分单个单元格？

对其他解决方案有什么建议吗？

【问题讨论】：

您是在尝试从您的应用程序中自动执行 OCR，还是在寻找最终用户应用程序？如果是后者，那么你应该像在 Stackexchange 上那样更好

标签： excel pdf ocr pdf-conversion abbyy

【解决方案1】：

ABBYY 有很多 OCR 产品，可配置的称为 FineReader Engine 和 FlexiLayout Studio。其他 ABBYY 产品没有要求的设置。

【讨论】：

谢谢。非常有帮助。我不知道这些产品。