ayajing

需要安装的依赖包:PIL  Pytesseract

1、安装包

PIL 就是pillow包,直接找到对应的whl包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/)

  注意:pillow是用于替代PIL的,所以在实际使用中需要import PIL而不是pillow

Pytesseract 直接pip安装

  注意:Pytesseract安装后不能直接使用,还需要安装Tesseract-OCR

             安装Tesseract-OCR后记录安装路径:D:/Download/tesseract/tesseract.exe

                  在Pytesseract的源码中修改

      源码路径:D:\Download\Anaconda\Lib\site-packages\pytesseract(我的Anaconda是安装在D:\Download文件夹中)

      修改文件pytesseract.py(将下面一行的内容修改为上面一行):

        tesseract_cmd = r\'D:/Download/tesseract/tesseract.exe\'

        # tesseract_cmd = \'tesseract\'

 

2、直接读取图片中的文字

from PIL import Image
import pytesseract

im = Image.open(\'001.png\')
text = pytesseract.image_to_string(im)
print(text)

注意:如果图片中有中文还需要下载中文库放在Tesseract-OCR的安装目录的tessdata 文件夹下

分类:

技术点:

相关文章: