【问题标题】:Perspective distortions correction透视失真校正
【发布时间】:2014-01-16 12:12:39
【问题描述】:
我正在寻找一种基于文档边框的文本识别方法。
或者可以解决寻找新观点问题的方法。
例如。相机在 (x1,y1,z1) 点,结果图片有透视变形,但我们可以找到 (x2,y2,z2) 让相机校正图片。
谢谢。
【问题讨论】:
-
This Sudoku solver 是一个相关问题的示例 - 它在照片中找到打印正方形的角,然后找到将其映射到单位正方形的透视变换(尽管它不关心相机坐标。)我认为你需要更具体地回答你的问题。
标签:
camera
geometry
computer-vision
【解决方案1】:
假设文档页面在 3D 空间中大致平坦,通常的方法是将包含页面的四边形扭曲为矩形。为此,您必须估计homography,即原始图像与其扭曲对应物之间的(线性)投影变换。
估计需要两个图像之间的匹配点(或线),并且文档的常见选择是将原始图像中的页面角映射到扭曲图像的图像角。这通常会产生一个具有不正确纵横比的矩形(即扭曲的页面看起来比真实的“更宽”或“更高”),但是如果您事先知道真实的纵横比是多少,这可以很容易地纠正是(例如,因为您知道使用的纸张类型,是 letter、A4 等)。
执行估计的简单算法是所谓的Direct Linear Transformation。
OpenCV 库包含有助于完成所有这些任务的例程,请查看它。