主要内容:
ICDAR自然场景文本识别有两个难度不同的挑战:难度较小的Focused Scene Text Detection 与难度较大的 Incidental Scene Text Detection。本文介绍前者。主要介绍其tasks与Localization(检测)任务的数据集。
Focused Scene Text Image
主要特点:
* 图片为自然场景图片
* 文字在图片中央,分辨率高,文字清晰可见。
针对 Focused Scene Text Image的挑战已经举行了3届,加上2017年的共四届。
Tasks
- 2011, Localization,Recognition
- 2013, Localization, Segmentation, Recoginition.
- 2015, Localization, Recognition, End-to-end.
- 2017, 同2015
值得一提的有两点: - 只有2013有Segmentation任务
- End-to-end从2015开始
Dataset For Localization
- 2011, 共485张图片,没有划分
train/test - 2013, 共462张图片,是2011图片的子集,但修改了几张图片的grouth truth texts。划分了
train(229)/test(223)两个子集.
2011与2013处理“不可辨识”文字的方法也不相同: - 2011:不处理,groundtruth里直接忽略。若用户检测出它们,evaluation时会判为False.
- 2013: ground truth里有它们的bounding box,但evaluation时忽略。
2015,2017的相应的Localization 数据集则一直沿用了2013的。
References
- ICDAR2017里的相应Challenge介绍 http://rrc.cvc.uab.es/?ch=2&com=introduction
- “ICDAR 2013 Robust Reading Competition”, In Proc. 12th International Conference of Document Analysis and Recognition, 2013, IEEE CPS
- “ICDAR 2011 Robust Reading Competition - Challenge 1: Reading Text in Born-Digital Images (Web and Email)”, In Proc.11th International Conference of Document Analysis and Recognition, 2011, IEEE CPS