Python Tesseract：int() 参数必须是字符串、类似字节的对象或数字，而不是“元组”答案

【问题标题】：Python Tesseract: int() argument must be a string, a bytes-like object or a number, not 'tuple`Python Tesseract：int() 参数必须是字符串、类似字节的对象或数字，而不是“元组”
【发布时间】：2019-02-04 05:07:51
【问题描述】：

我是机器学习的初学者，我想尝试文本提取代码。这是我的代码：

import pytesseract from PIL import Image 
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract OCR.exe" 
img = Image.open('image.png') 
img.load()
imgString = pytesseract.image_to_string(img)

但是，这会导致以下错误：

TypeError: int() argument must be a string, a bytes-like object or a number, not 'tuple`'

我正在使用 Jupyter Notebook (python 3) 来运行这个程序。有什么我可以做的吗？或者有没有更简单的方法可以从图像中提取文本？

【问题讨论】：

我认为你不需要调用 img.load()

标签： python machine-learning tesseract text-recognition python-tesseract

【解决方案1】：

Image.load() 方法

为图像分配存储空间并加载像素数据。一般情况下，不需要调用该方法，因为 Image 类在第一次访问时会自动加载打开的图像。

img.load()

到

#img.load()

【讨论】：

我删除了这个语句，它仍然给我同样的错误。
你提供了正方体二进制的有效路径吗？ @BobLee
是的，出于某种原因，它适用于某些图像，但不适用于其他图像
你能检查图像的形状，它没有用
它似乎适用于噪点不多的图像。它不适用于带有旋转文本的图像，有解决方法吗？

【解决方案2】：

可执行文件名错误，使用下面的代码你会得到答案

pytesseract.pytesseract.tesseract_cmd = "C:/Program Files (x86)/Tesseract-OCR/tesseract.exe"

其他代码行是文件。谢谢

【讨论】：