【问题标题】:How to improve results recognition with Tesseract?如何使用 Tesseract 提高结果识别率?
【发布时间】:2016-11-23 06:57:51
【问题描述】:

我用的是图片

我想从中识别数字

var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.TesseractOnly);
engine.SetVariable("tessedit_char_whitelist", "0123456789");
var img = Pix.LoadFromFile(@"D:/Ex.png");
var page = engine.Process(img);
var text = page.GetText();
Console.Write("Press any key to continue . . . ");
Console.ReadKey(true);

结果很糟糕31 3 963 如何改进?

【问题讨论】:

  • 在白名单engine.SetVariable("tessedit_char_whitelist", "0123456789/");中添加/字符
  • @MujahidDaudKhan,结果是一样的。

标签: c# ocr tesseract text-recognition


【解决方案1】:

您可以使用图片替换 eng 来训练自己的 tessdata 文件。 从github下载tesseract-ocr的源代码(https://github.com/tesseract-ocr/tesseract),and阅读wiki(https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract-3.00–3.02),它可以帮助你训练你的tessdata。 希望对您有所帮助。

【讨论】:

    猜你喜欢
    • 2011-06-01
    • 2017-07-21
    • 1970-01-01
    • 2016-06-02
    • 1970-01-01
    • 2014-12-21
    • 2019-03-30
    • 2016-11-14
    • 2018-07-03
    相关资源
    最近更新 更多