假设需要训练的图片为che.tif

1.tesseract.exe che.tif che batch.nochop makebox   生成che.box

2.用jTessBoxEditor 编缉box文件

3.tesseract.ext che.tif che nobatch box.train    生成che.tr che.txt

 

4.unicharset_extractor.exe che.box    生成unicharset

5.新建文件font_properties 内容为 che 0 0 0 0 0

6.mftraining.exe -F font_properties -U unicharset che.tr 生成inttemp mfunicharset Microfeat pffmtable

7.cntraing.exe che.tr 生成 normproto

 

8.将 unicharset normproto inttemp pffmtable 四个文件都加上 che.前辍

9.combine_tessdata.exe che. 若consol 2,4,5,6不为-1,则成功生成che.traindata

10.将che.traindata拷到tessdata目录中即可

 

使用:tesseract.exe che.jpg go -l che

相关文章: