1.图像数据处理

  1. 空域分析及变换
    Sobel,拉普拉斯,高斯,中值等
  2. 频域分析及变换
    傅里叶( Fourier )变换
    小波( Wavelet )变换
  3. 模板匹配,金字塔,滤波器组
  4. 特征数据操作
    主成分分析/PCA
    奇异值分解/SVD
    聚类/Cluster

2.图像特征及描述

  1. 颜色特征
    RGB,HSV,Lab等
    直方图
  2. 几何特征
    Edge,Corner,Blob等
  3. 纹理特征
    HOG,LBP,Gabor等
  4. 局部特征
    SIFT,SURF,FAST等

1.图像数据处理(Image Data Processing)

1.1.图片存储原理

• RGB 颜色空间
加法混色,彩色显示器
• 3通道
Red通道
Green通道
Blue通道
• 一个像素颜色值
(b, g, r)
• 取值范围
[0, 255]
[0.0, 1.0]
学习计算机视觉:(二)计算机视觉的基础

1.2.空域分析及变换:滤波/卷积

1.2.1.什么是卷积

学习计算机视觉:(二)计算机视觉的基础
卷积是在每个图片位置(x, y)上进行基于邻域的函数计算。

其中滤波函数又有以下叫法:卷积核、卷积模板;滤波器、滤波模板;扫描窗

不同功能需要定义不同的滤波函数,卷积的作用有以下两个:
1.图像增强:平滑/去燥;梯度/锐化
2.信息提取、检测:边缘、显著点、纹理;模式

卷积的边界补充有以下类型:
学习计算机视觉:(二)计算机视觉的基础

1.2.2.按作用分类卷积的类型

1.平滑/去噪

1.中值滤波
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
2.均值滤波
学习计算机视觉:(二)计算机视觉的基础
3.高斯滤波
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础

2.梯度/锐化

学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础

1.3.频域分析及变换

学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础

1.4.金字塔

学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础
学习计算机视觉:(二)计算机视觉的基础

1.4.模板匹配

模板图片匹配 vs 卷积:
1.作用:同尺度目标检测
2.模板:真实图片 vs 卷积核
3.操作:使用模板图片扫描整个图片 vs 卷积扫描
4.匹配结果:相似度量 vs 权重相加
返回相似度图
相似距离计算:
(标准化)欧式距离
(标准化)相关
(标准化)去均值相关

1.5.代码实践

•平滑滤波
http://docs.opencv.org/master/d4/d13/tutorial_py_filtering.html
•梯度滤波
http://docs.opencv.org/master/d5/d0f/tutorial_py_gradients.html
•傅里叶变换
http://docs.opencv.org/master/de/dbc/tutorial_py_fourier_transform.html
•模板匹配
http://docs.opencv.org/master/d4/dc6/tutorial_py_template_matching.html
•金字塔
http://docs.opencv.org/master/dc/dff/tutorial_py_pyramids.html

2.图像特征及描述(Image Feature & Descriptor)

2.1.特征提取方法(直方图,聚类)

2.1.1.直方图

  定义:颜色直方图是在许多图像检索系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。颜色直方图特别适于描述那些难以进行自动分割的图像。
  直方图:用于计算图片特征(Feature)、表达(representation)
  
  分类:对图片数据/特征分布的一种统计:
    灰度、颜色
    梯度/边缘、形状、纹理
    局部特征点、视觉词汇
  
  区间(bin):
    具有一定的统计或物理意义
    一种数据特征的代表
    需要预定义或基于数据进行学习
    数值是一种统计量:概率、频数、特定积累
  
  维度小于原始数据
  
  对数据空间(bin)进行量化方法:
    人工分割
    聚类算法进行无监督学习

2.1.2.聚类(Clustering)

目标:找出混合样本集中内在的组群关系,把一个对象集合分组或分割为子集或类,使得:
• 类内对象之间的相关性高
• 类间对象之间的相关性差

常用方法:
Kmeans (只覆盖)
EM算法
Mean shift
谱聚类
层次聚类

2.2.颜色特征(RGB,HSV,Lab)

2.3.几何特征(Edge,Corner,Blob)

2.4.纹理特征(HOG,LBP,Gabor)

2.5.局部特征(SIFT,SURF)

2.6.代码实践

相关文章: