【问题标题】:When converting PDF to Excel with Omnipage or Abbyy Finereader, is there are way to stop it from splitting individual cells?使用 Omnipage 或 Abbyy Finereader 将 PDF 转换为 Excel 时,有没有办法阻止它拆分单个单元格?
【发布时间】:2016-03-22 22:56:20
【问题描述】:

我正在尝试从 PDF 文件中提取一些表格,这两种工具(Abbyy 和 Omnipage)都可以很好地识别表格。但是在识别行和列时,它们都犯了同样的错误。

通常,当他们创建部分行时,问题就出现了,只水平拆分一个单元格,而不是其他单元格。有关我的意思的示例,请参见附图。在左侧的列中,一些单元格被分成两半,这使得表格在 Excel 中难以处理。

我觉得奇怪的是这些程序首先会这样做,因为带有拆分单元格的表格总是很痛苦。

有没有办法告诉这些程序只设置完整的列和行,而不是拆分单个单元格?

对其他解决方案有什么建议吗?

【问题讨论】:

  • 您是在尝试从您的应用程序中自动执行 OCR,还是在寻找最终用户应用程序?如果是后者,那么你应该像在 Stackexchange 上那样更好

标签: excel pdf ocr pdf-conversion abbyy


【解决方案1】:

ABBYY 有很多 OCR 产品,可配置的称为 FineReader Engine 和 FlexiLayout Studio。其他 ABBYY 产品没有要求的设置。

【讨论】:

  • 谢谢。非常有帮助。我不知道这些产品。
猜你喜欢
  • 2019-08-05
  • 1970-01-01
  • 1970-01-01
  • 2013-06-18
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-06-14
  • 1970-01-01
相关资源
最近更新 更多