最近需要做图片中文本识别的项目,然后为了快速验证模型,所以找到了mscoco-text数据集,网站1上是这么说的:

关于MSCOCO_text数据集的探索

官网是这么说的:
关于MSCOCO_text数据集的探索

然而,我下下来之后:
1 - 先导入:
关于MSCOCO_text数据集的探索

2 - 其中key为’imgToAnns’是图片序号对应的注释序号,却是这样的:
关于MSCOCO_text数据集的探索

关于MSCOCO_text数据集的探索

然后,其中具体的图片中文字并不是完全标记出来的,比如某张图片中其实一共至少4处文字,其实就标记了一处,更有甚者有的图片单词都是只标记了一半。虽然没错一共是有145862个文字例子存在:
关于MSCOCO_text数据集的探索

相关文章:

  • 2022-12-23
  • 2021-06-30
  • 2021-09-14
  • 2021-04-18
  • 2021-07-23
  • 2021-12-12
  • 2021-09-12
  • 2021-07-12
猜你喜欢
  • 2021-04-27
  • 2021-09-13
  • 2022-01-22
  • 2021-10-27
  • 2021-09-25
  • 2022-12-23
相关资源
相似解决方案