TextBoxes++

TextBoxes++是基于SSD和TextBoxes的。论文：https://arxiv.org/pdf/1801.02765.pdf

前言

文本检测和其他物体检测的区别：

(1) 文本检测有比较大的长宽比；

(2) 一半的convolutional filter无法全部检测到；

可能的解决方案：

(1) 长的卷积核；

(2) inception convolutional kernels;

(3) part detection and grouping.

与SSD区别：

(1) 把SSD的defaultbox的比例改成（1,2,3,5,7,10）的长矩形。

(2) 如下图所示，把原来的作为分类的卷积核3*3改成了1*5,更适合文本检测。

TextBoxes++

(3) 从多尺度变换成单尺度（textboxes系列算法对尺度的严重依赖性，对于不同尺度的图片，要调整不同的尺度效果才好）。

TextBoxes++

textboxes网络结构

TextBoxes++

SSD网络结构

参考：

[1] https://zhuanlan.zhihu.com/p/34131821