【发布时间】:2011-02-28 18:23:08
【问题描述】:
我开发了一个软件,可以将tiff转换为jpg,然后读取jpg文件,但是这个软件只有在jpg文件上有一个简单的写(意思是简单的英文字体)时才能工作,但是我想阅读草书字体,所以任何人都可以帮助我摆脱困境。我已经尝试了很多,但我找不到任何提示,所以请帮助..我不明白我使用了哪个库?所以请帮助我阅读具有草书文字的图像。
谢谢你 维普尔乔汉
【问题讨论】:
我开发了一个软件,可以将tiff转换为jpg,然后读取jpg文件,但是这个软件只有在jpg文件上有一个简单的写(意思是简单的英文字体)时才能工作,但是我想阅读草书字体,所以任何人都可以帮助我摆脱困境。我已经尝试了很多,但我找不到任何提示,所以请帮助..我不明白我使用了哪个库?所以请帮助我阅读具有草书文字的图像。
谢谢你 维普尔乔汉
【问题讨论】:
听起来您想在草书字体文档上执行OCR。如果你的意思是手写,我会立即放弃(一般来说这是一个非常困难的问题)。如果它是您拥有的特定字体(或者至少您可以创建该字体每个字母的图片数据库),那么您可以尝试使用可以使用新字体进行训练的现有 OCR 库。
例如:Tesseract-OCR 或 OCRopus。也可以尝试谷歌搜索“java ocr train”左右。
【讨论】: