“微信公众号”
本文介绍图像处理、计算机视觉、图像前背景分离技术等领域的术语。这里给出若干相关术语及本文对这些术语的解释。
1. 前背景分离(matting):也称抠图,即将图像或视频的某一感兴趣的部分从原始图像或视频中分离出来,主要功能是为了和另一个图像或视频进行合成,形成新的图像或视频。
2. 颜色空间(color space):颜色模型是使用一组值(通常三个、四个值或者颜色成分)表示颜色的抽象数学模型,比如RGB和CMYK都是颜色模型。在颜色模型和一个特定的参照颜色空间之间加入一个特定的映射函数就在参照颜色空间中确定了一个明确的色域,并且与颜色模型一起定义为一个新的颜色空间。
3. 前景蒙版(alpha matte):也称前景透明度或透明度蒙版,是前背景分离的结果,是一个灰度图,每一个像素点的灰度值表示原始图像每个像素属于前景物体的程度,白色代表某一个像素确定属于前景,黑色代表某一个像素确定属于背景。
4. 三值蒙版(trimap):是一些前背景分离方法使用的用户输入和约束条件,用户在原图像上指定哪些像素点是确定的前景,用白色表示;哪些像素点是确定的背景,用黑色表示;哪些像素点是不确定的部分,用某种灰色表示。三值蒙版越精细准确,得到的前背景分离结果越好,但对用户的要求更高,处理时间越长。
5. 简单标记(scribble):是一些前背景分离方法使用的用户输入和约束条件,用户在原图像上以一个或多个白色点或线条标记确定的前景,以一个或多个黑色点或线条标记确定的背景,标记越多、越具有代表性,得到的前背景分离结果越好,对用户的要求也更高。简单标记与三值蒙版相比较,用户输入更简单方便,能大大减少处理时间。
6. 边缘检测算子(edge detection operator):边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化,包括深度上的不连续、表明方向不连续、物质属性变化和场景照明变化。图像边缘检测大幅度地减少了数据量,留下了图像重要的结构属性。边缘检测算子包括:Roberts Cross算子、Prewitt算子、Sobel算子、Canny算子、罗盘算子等。Canny算子是最常用的边缘检测方法。
7. 视差图(disparity map):视差就是从有一定距离的两个点上观察同一个目标所产生的方向差异。从目标看两个点之间的夹角,叫做这两个点的视差,两点之间的距离称作基线。只要知道视差角度和基线长度,就可以计算出目标和观测者之间的距离。视差图是以图像对中任一幅图像为基准,其大小为该基准图像的大小,元素值为视差值的图像。
8. 深度图(depth map):本文中的深度图是黑白二值图,是通过对图像的视差图再处理或视频背景建模后获取深度的结果,作为本文前背景分离方法的约束条件。综合考虑原始图像的颜色信息和深度信息,可以得到更好的前背景分离效果。
9. 前背景分离方程(matting equation):自然图像I可看作由前景图像F和背景图像B组合而成,I中的每个像素点是F和B中对应像素点
和
颜色的线性组合。
(1)
为像素点的前景透明度,
。(1)式中,
已知,而
和
未知,是一个缺少条件的方程组。使用RGB颜色空间则有:
(2)
(2)式有7个未知量,却只有3个方程,如果不加其他条件,(2)式有无穷多解。有人眼来分辨一幅图像哪些部分属于前景,哪些部分属于背景,只有一个或几个可以接受的结果,前背景分离模型为将这一过程自动化,可对前景和背景合理假设,或者增加图像数量,使方程组的解变少,使解与人眼分辨结果尽可能接近。
读论文《图像前背景分离的研究与实现》的笔记。
地址:https://www.docin.com/p-1084120800.html