赛题来自天池的零基础入门cv,这是本人第一次入门cv赛事,这里记录整个小比赛的过程、算法、总结等,希望大家能从中获取有用的知识。

  • 赛题名称:街景字符编码识别(听名字就很有feel)
  • 赛题任务:要求选手预测街道字符编码,这是一个典型的字符识别问题,赛题数据采用公开数据集SVHN。
  • 数据下载:
    https://pan.baidu.com/s/1RMnufb2KV_sGTO8HwKwQ5w
    提取码:tiuy
  • 数据介绍:
    训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置;
    测试集A包括4W张照片,测试集B包括4W张照片。
    且训练集、验证集中提供了所有字符的位置框。
    训练数据每张图片将给出:对应的编码标签,具体的字符框的位置
    零基础入门CV- 街景字符编码识别(一)
    零基础入门CV- 街景字符编码识别(一)
  • 评测指标:Score=编码识别正确的数量/测试集图片数量
  • 本人目标:能够尽力完成比赛,完整完成一次cv建模流程,了解如何分析数据、如何选择适当的模型、以及算法的编写以及优化。
  • 解题思路:赛题本质是分类问题,需要对图片的字符进行识别,数据图片中不同图片中包含的字符数量不等,这里我们可以采用定长字符识别、不定长字符识别、目标检测后再识别。

相关文章: