使用opencv从扫描文档中提取明信片？答案

【问题标题】：Extract postcards from a scanned document using opencv?使用opencv从扫描文档中提取明信片？
【发布时间】：2018-04-23 12:49:58
【问题描述】：

我有 1000 张旧明信片要扫描，我认为使用某种自动裁剪/旋转工具优化我的工作流程可能是个好主意，因此我开始使用 Python 研究 openCV。

以下是我可以使用扫描仪获取的图片示例：

如您所想，我的目标是根据这张图片创建 3 张图片，每张图片包含一张明信片。我已经尝试了很多 opencv 选项，到目前为止我能得到的最好的代码是：

import cv2, sys, imutils

cv2.namedWindow('image', cv2.WINDOW_NORMAL)

image = cv2.imread("sample1600.jpg")
ratio = image.shape[0] / 300.0
image = imutils.resize(image, height = 800)

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray, (5, 5), 0)
ret, th = cv2.threshold(gray,220,235,1)
edged = cv2.Canny(th, 25, 200)

(cnts, _) = cv2.findContours(edged.copy(), cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted(cnts, key = cv2.contourArea, reverse = True)[:5]

for c in cnts:
    peri = cv2.arcLength(c, True)
    approx = cv2.approxPolyDP(c, 0.05 * peri, True)

    if len(approx) == 4:
        cv2.drawContours(image, [approx], -1, (0, 255, 0), 3)

cv2.imshow("Image", image)
cv2.waitKey(0)

生成的图像是：

这段代码的问题在于：

没有找到离边框太近的底部图片；
它只适用于我的测试图像，但似乎不是很通用。例如，“ret, th = cv2.threshold(gray,220,235,1)" 行会阻止事情处理我认为具有不同直方图的图像。

有没有人知道如何让这段代码更好地工作并更通用以满足我处理扫描图像的要求？

编辑：我最初没有提到但可能有用的是，单个明信片的宽度和高度之间的比率应该近似为 √2。情况并非总是如此，但如果我的脚本能够有效地处理这种类型的明信片，我会非常高兴（它们占我收藏的 > 99%）

edit 24/04：感谢@Riccardo，我现在有了一个适用于我的第一个示例图像的脚本，因此添加一个新的脚本以尝试找到更强大的解决方案：

edit 24/04 #2：由于@Riccardo 为前两个样本提供了非常有效的解决方案，因此由于第一个样本的图像之间的空间有限，这里还有两个似乎有点复杂：

或某些部分几乎是空白的卡片：

【问题讨论】：

顺便说一句，您可能希望扫描为 PNG 并仅将最终处理的明信片图像编码为 JPEG，以避免由于反复有损压缩而导致质量下降。 |太靠近边缘——如果你能控制扫描过程，你可以更好地放置它们——例如将底部的一个旋转 90 度会产生更好的适合度和良好的边距。 |在threshold 之后，使用cv2.copyMakeBorder 在图像周围添加一些额外的背景，以避免“太靠近边框”的问题。
感谢@Dan Mašek：我将控制扫描过程，但我的目标是在扫描仪中放置 4 张图片，因此无法旋转底部的一张。关于 png/jpg 问题，从我已经能够做的测试看来，它不会影响我到目前为止可以获得的结果的质量。

标签： python opencv scanning opencv-python

【解决方案1】：

我建议通过轮廓的旋转边界框的计算，而不是尝试识别固定形状。在我的尝试中，脚本识别出一个类似盒子的图形并计算其轮廓面积，然后它选择具有大面积的图形。

这应该可以解决您的问题，如果没有，请告诉我们。

cv2.namedWindow('image', cv2.WINDOW_NORMAL)

image = cv2.imread("sample1600.jpg")
ratio = image.shape[0] / 300.0
image = imutils.resize(image, height = 800)

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray, (5, 5), 0)


ret, th = cv2.threshold(gray,220,235,1)
edged = cv2.Canny(th, 25, 200)

im2, cnts, hierarchy = cv2.findContours(edged.copy(), cv2.RETR_TREE,   cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted(cnts, key = cv2.contourArea, reverse = True)

for c in cnts:
    box = cv2.minAreaRect(c)
    box = cv2.cv.BoxPoints(box) if imutils.is_cv2() else cv2.boxPoints(box)
    box = np.array(box, dtype="int")
    if cv2.contourArea(box) > 70000:
        cv2.drawContours(image, [box], -1, (0, 255, 0), 2)

cv2.imshow("Image", image)
cv2.waitKey(0)

这是输出：

编辑：我不知道这是否是正确的解决方案，可能还有其他的。我鼓励其他用户分享他们的方法。 @Sylvain，这是另一个调整参数的尝试：

将阈值降低到 210；
删除了 canny 函数（它会干扰某些图像的复杂模式；

计算图像区域并玩弄要返回的轮廓的限制。在这个特定示例中，我将轮廓设置为大于图像的 1/10 且小于 2/3。

image = cv2.imread(img)

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray, (5, 5), 0)

ret, th = cv2.threshold(gray,210,235,1)

im2, cnts, hierarchy = cv2.findContours(th.copy(),cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted(cnts, key = cv2.contourArea, reverse = True)

for c in cnts:
    box = cv2.minAreaRect(c)
    box = cv2.cv.BoxPoints(box) if imutils.is_cv2() else cv2.boxPoints(box)
    box = np.array(box, dtype="int")
    Area = image.shape[0]*image.shape[1]
    if Area/10 < cv2.contourArea(box) < Area*2/3:
        cv2.drawContours(image, [box], -1, (0, 255, 0), 2)

cv2.imshow("Image", image)
cv2.waitKey(0)

【讨论】：

感谢@Riccardo，这是对我原始版本的极大改进。这在第一张图片上效果很好，但仍然错过了我添加到原始帖子中的 new sample 上的一些卡片。如果您对如何解决这个问题有任何想法，那就太好了！无论如何，已经非常感谢第一个答案，不希望这么快就有一个可行的解决方案。
很高兴有用。我正在研究这个主题，我发现你的问题很有挑战性
感谢@Riccardo，我会将这个答案标记为正确，因为它已经修复了我的两个图像。但是，如果您想要更多挑战，我添加了另外两个示例，它们似乎更复杂，或者至少尚未被您的最新版本代码处理。
我相信你可以自己解决这个问题，只要像我一样调整参数，结果就会出来。享受