【发布时间】:2018-04-23 12:49:58
【问题描述】:
我有 1000 张旧明信片要扫描,我认为使用某种自动裁剪/旋转工具优化我的工作流程可能是个好主意,因此我开始使用 Python 研究 openCV。
如您所想,我的目标是根据这张图片创建 3 张图片,每张图片包含一张明信片。我已经尝试了很多 opencv 选项,到目前为止我能得到的最好的代码是:
import cv2, sys, imutils
cv2.namedWindow('image', cv2.WINDOW_NORMAL)
image = cv2.imread("sample1600.jpg")
ratio = image.shape[0] / 300.0
image = imutils.resize(image, height = 800)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray, (5, 5), 0)
ret, th = cv2.threshold(gray,220,235,1)
edged = cv2.Canny(th, 25, 200)
(cnts, _) = cv2.findContours(edged.copy(), cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted(cnts, key = cv2.contourArea, reverse = True)[:5]
for c in cnts:
peri = cv2.arcLength(c, True)
approx = cv2.approxPolyDP(c, 0.05 * peri, True)
if len(approx) == 4:
cv2.drawContours(image, [approx], -1, (0, 255, 0), 3)
cv2.imshow("Image", image)
cv2.waitKey(0)
这段代码的问题在于:
- 没有找到离边框太近的底部图片;
- 它只适用于我的测试图像,但似乎不是很通用。例如,“ret, th = cv2.threshold(gray,220,235,1)" 行会阻止事情处理我认为具有不同直方图的图像。
有没有人知道如何让这段代码更好地工作并更通用以满足我处理扫描图像的要求?
编辑:我最初没有提到但可能有用的是,单个明信片的宽度和高度之间的比率应该近似为 √2。情况并非总是如此,但如果我的脚本能够有效地处理这种类型的明信片,我会非常高兴(它们占我收藏的 > 99%)
edit 24/04:感谢@Riccardo,我现在有了一个适用于我的第一个示例图像的脚本,因此添加一个新的脚本以尝试找到更强大的解决方案:
edit 24/04 #2:由于@Riccardo 为前两个样本提供了非常有效的解决方案,因此由于第一个样本的图像之间的空间有限,这里还有两个似乎有点复杂:
【问题讨论】:
-
顺便说一句,您可能希望扫描为 PNG 并仅将最终处理的明信片图像编码为 JPEG,以避免由于反复有损压缩而导致质量下降。 |太靠近边缘——如果你能控制扫描过程,你可以更好地放置它们——例如将底部的一个旋转 90 度会产生更好的适合度和良好的边距。 |在
threshold之后,使用cv2.copyMakeBorder在图像周围添加一些额外的背景,以避免“太靠近边框”的问题。 -
感谢@Dan Mašek:我将控制扫描过程,但我的目标是在扫描仪中放置 4 张图片,因此无法旋转底部的一张。关于 png/jpg 问题,从我已经能够做的测试看来,它不会影响我到目前为止可以获得的结果的质量。
标签: python opencv scanning opencv-python