【发布时间】:2017-02-06 20:53:33
【问题描述】:
好的,所以我花了今天最好的时间来尝试让 ocr 正常工作,它不再崩溃,但是当我给它一个包含文本而不是数字的文件时,会抽出很多奇怪的文本.. .
源代码:
using System;
using System.Collections.Generic;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using tessnet2;
namespace OCRTest
{
class Program
{
static void Main(string[] args)
{
try
{
var image = new Bitmap(@"C:\Users\Ryan\Documents\visual studio 2015\Projects\OCRTest\testimage.jpg");
var ocr = new Tesseract();
ocr.Init(@"C:\Users\Ryan\Documents\visual studio 2015\Projects\OCRTest\tessdata", "eng", true);
var result = ocr.DoOCR(image, Rectangle.Empty);
foreach (Word word in result)
{
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
}
}
catch (Exception exception)
{
Console.WriteLine(exception);
}
Console.ReadLine();
}
}
}
就像我说的,我正在使用 tessnet2 和 eng tessdata。
当我输入这张图片时:
我从程序中得到这个响应:
提前感谢您提供的任何帮助或指向您可能拥有的更多教程的链接 - 我遵循 this 教程到此为止.. Ryan
【问题讨论】:
标签: c# .net visual-studio ocr tesseract