【发布时间】:2019-10-10 01:36:54
【问题描述】:
请在此处下载附件并保存为/tmp/target.jpg。
可以看到jpg中有0244R,我用下面的python代码提取字符串:
from PIL import Image
import pytesseract
import cv2
filename = "/tmp/target.jpg"
image = cv2.imread(filename)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
ret, threshold = cv2.threshold(gray,55, 255, cv2.THRESH_BINARY)
print(pytesseract.image_to_string(threshold))
我得到的是
0244K
正确的字符串是0244R,如何使图像更具对比度,灰度然后用PIL和pytesseract得到所有字符?
这是生成图像的网页:
【问题讨论】:
-
风险在于人们将提供仅适用于该图像的解决方案。你有生成这张图片的代码吗?
-
上次您提出此问题stackoverflow.com/questions/57183997/… 时,向您展示了执行此类清洁所需的过程。这不是一个完美的过程。
-
@potential answerers,这是一个用于在中国人民大学出版社创建帐户和登录的机器人验证crup.cn/Account/Login 我不知道 OP 打算用它做什么,但如果你在中国,帮助规避此问题的 OP 可能不符合犹太教规。
-
@Scott 仅供参考!
-
每天登录网站手动获取积分,我厌倦了这种操作,我想编写一个程序来登录并为我获取积分。
标签: python-3.x python-tesseract