【问题标题】:Python Tesseract: int() argument must be a string, a bytes-like object or a number, not 'tuple`Python Tesseract:int() 参数必须是字符串、类似字节的对象或数字,而不是“元组”
【发布时间】:2019-02-04 05:07:51
【问题描述】:

我是机器学习的初学者,我想尝试文本提取代码。这是我的代码:

import pytesseract from PIL import Image 
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract OCR.exe" 
img = Image.open('image.png') 
img.load()
imgString = pytesseract.image_to_string(img)

但是,这会导致以下错误:

TypeError: int() argument must be a string, a bytes-like object or a number, not 'tuple`'

我正在使用 Jupyter Notebook (python 3) 来运行这个程序。有什么我可以做的吗?或者有没有更简单的方法可以从图像中提取文本?

【问题讨论】:

  • 我认为你不需要调用 img.load()

标签: python machine-learning tesseract text-recognition python-tesseract


【解决方案1】:

Image.load() 方法

为图像分配存储空间并加载像素数据。一般情况下,不需要调用该方法,因为 Image 类在第一次访问时会自动加载打开的图像。

img.load()

#img.load()

【讨论】:

  • 我删除了这个语句,它仍然给我同样的错误。
  • 你提供了正方体二进制的有效路径吗? @BobLee
  • 是的,出于某种原因,它适用于某些图像,但不适用于其他图像
  • 你能检查图像的形状,它没有用
  • 它似乎适用于噪点不多的图像。它不适用于带有旋转文本的图像,有解决方法吗?
【解决方案2】:

可执行文件名错误,使用下面的代码你会得到答案

pytesseract.pytesseract.tesseract_cmd = "C:/Program Files (x86)/Tesseract-OCR/tesseract.exe"

其他代码行是文件。谢谢

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-03-17
    • 2017-02-15
    • 1970-01-01
    • 2019-08-15
    • 2016-12-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多