【发布时间】:2016-03-22 22:56:20
【问题描述】:
我正在尝试从 PDF 文件中提取一些表格,这两种工具(Abbyy 和 Omnipage)都可以很好地识别表格。但是在识别行和列时,它们都犯了同样的错误。
通常,当他们创建部分行时,问题就出现了,只水平拆分一个单元格,而不是其他单元格。有关我的意思的示例,请参见附图。在左侧的列中,一些单元格被分成两半,这使得表格在 Excel 中难以处理。
我觉得奇怪的是这些程序首先会这样做,因为带有拆分单元格的表格总是很痛苦。
有没有办法告诉这些程序只设置完整的列和行,而不是拆分单个单元格?
对其他解决方案有什么建议吗?
【问题讨论】:
-
您是在尝试从您的应用程序中自动执行 OCR,还是在寻找最终用户应用程序?如果是后者,那么你应该像在 Stackexchange 上那样更好
标签: excel pdf ocr pdf-conversion abbyy