一、选择题

选择题总共5个,每个3分。整体来说不难,主要是一些计算机视觉的基础题,但是如果看过时间太久了可能就忘记了,考前复习很有必要呀,我是没戏了。

1、图像边缘检测的卷积核是什么样的形式?

Roberts,Sobel,Prewitt,LOG,Canny

2、图像去噪滤波的方式有哪些?

均值滤波,中值滤波,最大最小值滤波,双边滤波,引导滤波

3、哪些排序算法的时间复杂度为O(nlogn)O(n\cdot log_{n})?

2019校招笔试(感知算法)
十大排序算法

4、影响相机内参的因素有哪些?

焦距(fx 和 fy),中心像素坐标(u0和v0),坐标轴倾斜系数s,以及径向畸变系数(k1,k2,k3)和切向畸变系数(p1,p2)。

5、【不记得了】


二、填空题

填空题总共9个,每个5分。填空题我个人感觉就有点难了,可能是面向不同人的题吧,面还是比较广的,问题基本上都见过,在论文、博客什么的都研究过也看过,但是直接在笔试的时候凭脑子写,好吧我认输,自己还是太菜。。。只有几个题还会写一点。

1、计算空间中点到直线的距离。

我想了想应该是用叉积就可以了:直线 ll 是过零点,其方向向量表示为:nl=(x0,y0,z0)\vec n_{l}=(x_{0},y_{0},z_{0}),点就是空间一点a(xi,yi,zi)a(x_{i},y_{i},z_{i}),将其表示为起于零点的向量a=(xi,yi,zi)\vec{a}=(x_{i},y_{i},z_{i}),则点 aa 到直线 ll 的距离表示为d=nl×ad=\vec n_{l}\times \vec{a}

2、正态分布相关问题。

X1,,XmX_{1},\cdot \cdot \cdot,X_{m}来自于总体XN(μ,σ2)X\sim N(\mu,\sigma^{2})的样本,则E(σm2)=?E(\sigma ^{2}_{m})=?

解答:E(Xˉ)=μ,D(Xˉ)=σ2mE(\bar{X})=\mu , D(\bar{X})=\frac{\sigma^{2}}{m},则E(σm2)=σ2E(\sigma^{2}_{m})=\sigma^{2}

3、图像识别中的几种特征描述子。

这个问题是很简单的,只要看过几篇论文,几篇博客就知道了,而且确实很多。

\bullet斑点检测类:DOG , LOG , SIFT , SURF;
\bullet焦点检测类:Harris , FAST ;
\bullet二进制类:BRIEF , BRISK , ORB .

等等,这类比较多,随便写。


  • 顺便说一下三维的,也方便自己记忆

三位识别方面的描述子主要分为局部特征描述子全局特征描述子

局部特征描述子:

  1. PFH (Point Feature Histogram) (点特征直方图)
  2. FPFH (Fast Point Feature Histogram) (快速点特征直方图) ,
  3. RSD (Radius-Based Surface Descriptor) (半径表面描述子) ,
  4. 3DSC (3D Shape Context) (3D形状上下文) ,
  5. USC (Unique Shape Context) (唯一形状上下文) ,
  6. SHOT (Signatures of Histogram Orientations) (方向签名直方图) ,
  7. Spin Image (旋转图) ,
  8. RIFT (Rotation-Invariant Feature Transform) (旋转不变特征变化) ,
  9. NARF (Normal Aligned Radial Feature) (法线对齐半径特征);
  10. RoPS (Rotation Projection Statistics) (旋转投影统计)

全局特征描述子:

  1. VFH (Point Feature Histogram) (点特征直方图)
  2. CVFH (Fast Point Feature Histogram) (快速点特征直方图) ,
  3. OUR-CVFH (Radius-Based Surface Descriptor) (基于半径的表面描述子) ,
  4. ESH (3D Shape Context) (3D形状上下文) ,
  5. GFPFH (Global Fast Point Feature Histogram) (全局快速点特征直方图)
  6. GRSD (Global Radius-Surface Descriptor) (全局半径表面描述子)

表格表示
2019校招笔试(感知算法)图源[1]。
注:

+标有星号()的值表示描述符的大小取决于某些参数,给定的值是默认值。
++没有星号(
)的是自定义PointType的描述符,使用通用的“pcl :: Histogram <>”类型。

4、相机M1坐标系到相机M2坐标系的变换。

5、旋转矩阵的几种表示方式

题目给出了3X3的旋转矩阵(Rotation Matrix)形式,
其他的还有:

EA : 欧拉角(Euler Angle),
RV : 旋转向量(Rotation Vector),
AA : 轴角(Axis-Angle),
Q : 四元数(Quaternion)
DCM : 方向余弦矩阵(Direction Cosine Matrix)–类似于旋转矩阵

6、【忘记了】

7、【忘记了】

8、【忘记了】

9、【忘记了】

三、解答题

1、卷积操作。

给定一个800x800大小的网络,3通道,卷积核size为3x3,stride为1,padding为1,pooling为max pooling,经过几次操作,得到的特征层维度?每个区域感受野?

2、k-means算法相关问题。

优点:易于实现
缺点:可能收敛于局部最小值,在大规模数据收敛慢

3、双目视觉相机baseline与测距极限的关系。

两个相机的焦距都为f,成像最小分辨率为两个像素
·根据视差计算原理
2019校招笔试(感知算法)
图中:OL,ORO_L ,O_R ——左右光心;
    PL,PRP_L,P_R —— 左、右相机平面上关于三维空间中点 PP 的像点;
    uL,uRu_L,u_R —— 左、右成像平面上像点的坐标,这里 uRu_R 为负数;
    ff —— 相机焦距;
    bb —— 左右相机之间的基线(Baseline);
    zz —— 三维空间中点 PP 到相机光心平面的深度值。
左右像素的几何关系为: POLORPPLPR\triangle P O_L O_R \sim\triangle P P_L P_R,于是可得
zfz=b(uL)(uR)b=buL+uRb\frac{z - f}{z} = \frac{b - (u_L)-(-u_R)}{b} = \frac{b - u_L + u_R}{b}
又有左右图像的视差(Disparity)d:
d=uL+uR=uLuRd = |u_L| + |u_R| = u_L - u_R
于是可以整理得到:
z=bfdz = \frac{bf}{d}
根据以上推理结果可以得出:
——视差越大,观测距离越近;
——基线越宽,观测距离越远;
——视差计算困难,计算量和精度是关键难点。

引用参考

[1] 文中图片来源

相关文章: