jifeng

1、pdf阅读器adobe acrobat DC  v2019 008 20074

  可以识别pdf书中的文字(图片上选择区域右键选复制,软件会自动ocr)

  把pdf 每一页导出为图片

2、Tesseract-OCR 

  把图片识别为文本文件,google的开源项目

tesseract "F:\pdfTotxt\pdf\页面_023.jpg"  txt023 –l eng

  

分类:

技术点:

相关文章:

  • 2021-10-19
  • 2021-10-04
  • 2021-12-28
  • 2021-12-29
  • 2021-12-03
猜你喜欢
  • 2021-12-16
  • 2021-12-15
  • 2022-01-02
  • 2021-11-09
  • 2021-07-02
  • 2021-12-16
  • 2021-06-05
相关资源
相似解决方案