【问题标题】:Tessnet2 OCR returns only numbersTessnet2 OCR 仅返回数字
【发布时间】:2013-04-05 13:45:55
【问题描述】:

我正在尝试在 c# 应用程序中使用 tessnet2 从图像中读取文本。 这是我的代码:

string valoare="";
lblOCR.Text = "";

Bitmap image = new Bitmap(@"C:\Stamp\test.png");
tessnet2.Tesseract ocr = new tessnet2.Tesseract();
ocr.Init(@"F:\Manipulare pdf\bin(1)\Release32\tessdata", "eng", false); 
var rect = new System.Drawing.Rectangle();
List<tessnet2.Word> result = ocr.DoOCR(image, rect);

int lc = tessnet2.Tesseract.LineCount(result);
foreach (tessnet2.Word word in result)
{
lblOCR.Text += word.Text+" "+word.Confidence+"<br/>";
}

结果字符串只包含数字,但我的图片包含字母,我不明白为什么。

谢谢

【问题讨论】:

  • 可能与图像的方向有关吗?我不确定他们是否为 C# 包装器实现了“自动”方向,我知道它在 C++ 源代码中......

标签: c# ocr tesseract tessnet2


【解决方案1】:

尝试再次放入语言包。

Tessnet2 适用于语言包 2 及更高版本。

【讨论】:

    【解决方案2】:

    我知道我来晚了。我在其他地方找到了解决方案。

    我的 ocr 被配置为只看到数字。但我看到你没有这条线:

    ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digits only
    

    对我来说,删除它就可以了。也许你需要类似这样的配置。

    【讨论】:

      猜你喜欢
      • 2016-07-15
      • 2017-02-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多