文章目录
动机
视觉使人类得以感知和理解周边的世界。相应地,计算机视觉的目标是通过电子化感知和理解图像复制人类视觉的效果 。
图像获取、 前期处理、分割、 模型拟合、运动预测、定性/定量结论,都体现了图像理解和计算机视觉问题的特征。
许多计算机视觉技术使用了 包括数学、模式识别、人工智能(AI)、 心理生理学、计算机科学、 电子学以及其他科学领域的结果和方法。
计算机视觉为什么是困难的
在3D→2D中信息损失
从数理逻辑以及(或者) 语言学的角度看, 图像的解释可以看作是下列映射:
解释: 图像数据→模型
- 噪声
- 太多数据
- 亮度量测
- 局部窗口和对全局视图的需要
图像表达与图像分析的任务
图像表达和关联的算法的层次结构常常以更简单的方式分类,通常使用两个层次:低层图像处理和高层图像理解。
1. 低层处理方法通常很少使用有关图像内容的知识。计算机知道的图像内容一般都是由高层算法或直接由知道问题领域的人提供的。低层图像处理一般包括图像压缩、噪声滤波、边缘提取和图像锐化等预处理方法。
2. 高层处理是取决于知识、 目标以及如何达到这些目标的计划,人工智能方法是广泛可用的。 高层计算机视觉试图模仿人类的认知(但是请留心本章第一段中所给出的适度忠告)和根据包含在图像中的信息进行决策的能力。
低层计算机视觉技术儿子与数字阁像处理完全重合, 这方面已经有几十年的实践了。
低层图像处理与高层计算机视觉区别在于所使用的数据。 低层数据由原始图像构成,表现为亮度(或类似)数值组成的矩阵,而高层数据虽然也来源T图像但只有那些与高层目标有关的数据被提取出来,很大程度地减少了数据量。高层数据表达了有关阁像内容的知识,例如,物体的大小、形状以及图像中物体的相互关系。高层数据通常表达为符号形式。
大多数低层图像处理方法是在20世纪70年代或更早提出来的。近来的研究包括尝试寻找效率更高和更一般的算法,并将其在技术上更为复杂的仪器上实现,特别地, 为了减轻在图像数据集合上进行操作的巨大计算负担,正在使用并行机。产生更大图像(更好的空间分辨率)和更多色彩的技术推动着对寻求更好更快算法的需求。
总结
- 人类视觉是自然的, 看起来容易: 计算机模仿视觉是困难的。
- 我们可以期望通过检查图片或图片序列来获得定量和定性的分析。
- 很多标准的或高级的AI技术是相豆关联的。
- “ 高” 和“ 低” 层的计算机视觉可以分别开。
- 处理从数字化操作开始, 然后是预处理、分割、识别和理解, 但是这些过程可以是同时的和彼此合作的。
- 理解启发式、先验知识、语法和语义概念是必要的。
- 视觉文献是大量的、成长的, 书可以分为专著的、基本的和高级的。
- 在本领域为了保持先进性, 必须了解研究文献。
- 电子出版和Internet 的发展使视觉入门更简单了。