tesseract win 训练

1.整理图片

tesseract win 训练

tesseract win 训练

tesseract win 训练

2. 生成box文件

tesseract mytest.tif mytest batch.nochop makebox

3.进行校对

tesseract win 训练

4.训练

字符特征文件（*.tr）

tesseract test.tif test nobatch box.train

计算字符集（unicharset）

unicharset_extractor test.box

定义字体特征文件并聚集字符特征

新建font_properties文件，并输入
test 0 0 0 0 0
test 必须与训练名中的名称保持一致,填入下面内容 ,这里全取值为0，表示字体不是粗体、斜体等等

mftraining -F font_properties -U unicharset test.tr

cntraining test.tr

把unicharset, inttemp, normproto, pffmtable,shapetable文件加上前缀“test.”。然后合并训练文件,生成traineddata

combine_tessdata test.

查看新的语言包
将test.traineddata放到tesseract的traindata文件夹下。
tesseract --list-langs

至此就完成了训练。

5.测试训练结果

文章资源下载：
tesseract：https://download.csdn.net/download/claroja/10711353
java环境：https://download.csdn.net/download/claroja/10711344
java11好像不能用，这里用java8

参考文献：
https://www.jianshu.com/p/5c8c6b170f6f
http://vietocr.sourceforge.net/

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode