Tesseract-OCR 工具中的 text2image.exe ,下载其他人编译的在 win 系统都无法正常运行.
折腾了好久终于编译出能正常运行的.
--font="font name"  指定字体名字时需要用双引号, 不能用单引号.
--text="input file" 要输入的文本文件需要用 UTF-8 格式.

字体名字需要先运行 text2image --list_available_fonts 命令, 查看有效字体.
比如:
$ text2image --list_available_fonts
  0: Agency FB
  1: Agency FB Bold
  2: Agency FB Bold Oblique
  3: Agency FB Oblique
  4: Algerian
  5: Arial
  6: Arial Black, Heavy
  7: Arial Black, Heavy Oblique

想用第6个字体, 字体名字要写成 --font="Arial Black, Heavy"
字体名字中的逗号也一定要写.


_Tesseract-3.05-training-bin-win32-20160805-shared.7z
_Tesseract-3.05-training-bin-win32-20160808-static.7z

相关文章:

  • 2021-11-12
  • 2022-12-23
  • 2021-12-04
  • 2021-11-13
  • 2021-11-30
  • 2021-11-30
  • 2021-10-31
猜你喜欢
  • 2021-12-10
  • 2022-02-20
  • 2021-06-08
  • 2022-12-23
相关资源
相似解决方案