论文信息:《Evaluation of Shape Descriptors for Shape-Based Image Retrieval》——2011年

    这篇论文,比较了四种形状描述符,分别是傅里叶描述符(FD)、曲率尺度空间描述符(curvature scale space)、角度径向变换(angular radial transform)和图像矩描述符(image moment descriptors)。这四种描述符都具有尺度、旋转、平移不变性,论文的结果表明,图像矩描述符在形状表示质量方面表现出最佳性能,而角度径向变换的描述符则是最小的

    与其他特征(如纹理和颜色)相比,形状表示在语义表征图像内容方面更有效。 然而,形状描述符的挑战性任务是形状信息的准确提取和表示。文献中存在各种形状描述符,主要分为两组:基于轮廓的形状描述符和基于区域的形状描述符。 基于轮廓的方法需要提取边界信息,在某些情况下可能无法获得。 但是,基于区域的方法不依赖于形状边界信息,但它们考虑了形状区域内的所有像素。 因此,出于通用目的,两种类型的形状表示都是必要的。

    本篇论文中,描述了四个重要的形状描述符:傅立叶描述符,曲率尺度空间描述符,角度径向变换描述符和图像矩描述符。 傅里叶描述符和曲率尺度空间描述符是基于轮廓的,因为它们是从轮廓中提取的,而图像矩和角度径向变换描述符是从整个形状区域中提取的。

    1.傅立叶描述符(FD)已成功应用于许多形状表示应用,尤其是字符识别。 它们的优良特性,例如简单的推导,简单的归一化以及对噪声的鲁棒性,使它们在广泛的应用中非常流行。并且,在上一篇文章中已经介绍了FD,此处就不做过多赘述了。(如果可以,可以单开一个文章来详细描述FD)

    2.CSS。在上一篇文章中也做了介绍,此处就不做过多介绍了。

    3.角径向变换。角径向变换(ART)是MPEG-7中采用的基于矩的图像描述方法,作为基于2D区域的形状描述符。ART是基于极坐标中的复正交正弦基函数在单位盘上定义的复正交单位变换。ART系数,n阶和m阶的Fnm由下式定义

基于形状图像检索的形状描述符评估——18.07.30

    ART描述符被定义为该组ART系数的一组归一化幅度。 通过使用系数的大小来获得旋转不变性。为了实现平移不变性,极坐标系的中心被定义为物体的质心,可以通过几何矩来轻松获取

基于形状图像检索的形状描述符评估——18.07.30

    根据MPEG-7标准,ART描述符由140比特表示,由35个4比特系数组成,因为定义计算的系数归一化的阶数(n <3,m <12)。 因此,归一化的缩放不变系数由下式给出

基于形状图像检索的形状描述符评估——18.07.30

    4.图像矩

    图像矩IM已被证明适用于各种识别任务。 所选择的图像矩不仅在对象的平移,旋转和缩放下不变,而且在一般仿射变换下也是如此。 仿射矩不变量是通过代数不变量理论推导出来的,更具体地说是通过将仿射变换分解为六个单参数变换的方法得到的。 使用的六个仿射不变量定义如下:

基于形状图像检索的形状描述符评估——18.07.30

基于形状图像检索的形状描述符评估——18.07.30

比较结果:

基于形状图像检索的形状描述符评估——18.07.30

表1 使用FD,CSS,ART和IM进行检索的时间

基于形状图像检索的形状描述符评估——18.07.30

图2 索引核心实验CE-Shape-1图像数据库所需的数据库大小(描述子占的存储空间)

    对于性能测量,我们使用检索的精度和召回来评估查询结果。 精度P被定义为检索的相关形状的数量r与检索的形状的总数的比率n,P = r / n。 Precision P可以测量检索的准确性和召回的速度。 召回R被定义为在整个数据库中检索的相关图像的数量r与相关形状的总数m的比率,R = r / m。 Recall R测量检索性能的稳健性。

    为了研究每个形状描述符的行为,我们首先以两种不同的形状呈现它们的检索性能。 第一种形状如图3(a)所示,表示具有很大边界变化的玻璃。 第二种形状是圆形装置,沿其圆形形状具有精细细节,如图4(a)所示。 从精确回忆图中可以看出,FD对于一般边界变化更加鲁棒,而CSS无法检索没有突出轮廓的对象。 IM具有良好的整体性能,但是与两种形状的结果相比,可以看出它在圆形装置中具有优越性,因为它可以捕捉轮廓的精细细节。 ART在两种形状中均表现出平均性能,实现了准确性和复杂性之间可接受的折衷。

基于形状图像检索的形状描述符评估——18.07.30

图3 使用FD,CSS,ART和IM检索玻璃-18的结果:(a)查询图像; (b)查询图像的精确/调用图

(想要全部找到目标物体,精度就会下降,反之只找到极少的目标物体,找到的极少的目标物体占目标物体总数的比例就会降低)

基于形状图像检索的形状描述符评估——18.07.30

图4 使用FD,CSS,ART和IM为device9-15检索结果:(a)查询图像; (b)查询图像的精确/调用图

总结:在本文中,我们对形状检索的四个形状描述符进行了研究和比较。 结果表明,在缩放,平移和旋转不变性和紧凑性方面,图像矩描述符比其他三种方法获得更多的信用。 尽管图像矩描述符缺少在基于轮廓的描述符中反映的轮廓信息,但是检索结果有利于其性能。 角度径向变换是一种小而简单的描述符,具有快速检索答案,呈现最低的平均检索时间,使其适用于仅需要低级计算复杂度的情况。

相关文章: