【发布时间】:2017-12-07 10:10:39
【问题描述】:
有没有什么办法使用tesseract ocr检测表。
我正在使用以下 c# 代码 (charlesw/tesseract)
using (var iter = page.GetIterator())
{
iter.Begin();
do
{
var blockType = iter.BlockType; // Never equals to Table
} while (iter.Next(PageIteratorLevel.Word));
}
遍历块并查询BlockType 属性,但它永远不会返回PolyBlockType.Table 值,即使我的文档中有表格
我也尝试将“textord_tabfind_find_tables”变量设置为 true,但没有成功。
【问题讨论】:
-
您是否尝试过更改页面分割模式?现在设置的是哪种模式? github.com/tesseract-ocr/tesseract/wiki/…