【问题标题】:How can I find Imagenet data labels?如何找到 Imagenet 数据标签?
【发布时间】:2017-04-06 07:06:18
【问题描述】:

我有两个关于如何加载 Imagenet 数据的问题。 我下载了 ILSVRC2012 验证集(因为训练集太大) 但我有两个问题。

  1. 我不明白如何才能找到标签。 只有 jpeg 文件的文件名类似于“ILSVRC2012_val_00000001.JPEG”,但没有标签。我怎样才能找到它们?

  2. 据我所知,Imagenet 使用 224 * 224 像素的图像,问题只是“分类”而不是“检测”,但 ILSVRC2012 集有更多不同的像素大小。那么,如何才能获得 224 * 224 像素的正确框?

【问题讨论】:

标签: tensorflow deep-learning imagenet


【解决方案1】:

确保从here 下载并解压每个文件 .tar 到一个文件夹中,每个类的编号为synsent。最好的办法就是不要把图片混在一起。

【讨论】:

【解决方案2】:

它在开发工具包中(任务 1 和 2) 文件名为“ILSVRC2012_validation_ground_truth.txt”

【讨论】:

    【解决方案3】:
    1. 您将下载三个 tar 存档:一个用于训练数据,一个用于验证数据,一个用于测试数据。

      训练数据包含在 1000 个文件夹中,每个类别一个文件夹(每个文件夹应包含 1300 张 JPEG 图像)。验证数据是一个包含 50k JPEG 图像的单个文件夹,在中查找对应的 ILSVRC2012_validation_ground_truth.txt 文件(正如 darren1231 提到的,它需要作为 DevKit 的一部分单独下载)。

    测试数据类似于验证数据,但它没有标签(未向您提供标签,因为您需要将预测的标签提交给他们,作为比赛的一部分)。

    1. ImageNet 图像具有可变分辨率,平均为 482x415,您可以自行决定如何处理它们以训练模型。大多数人处理它如下:首先缩小每个图像,使其短边为256像素。然后裁剪一个随机的 224x224 补丁。使用这些补丁进行训练(每个时期你会得到不同的作物)。在测试期间,做同样的事情,但提取一个中心 224x224 补丁,并使用它来评估分类准确性。有些人还使用多个补丁进行测试。同样,这取决于您,如果您愿意,可以使用更高的分辨率。

    【讨论】:

      猜你喜欢
      • 2017-11-30
      • 2017-11-26
      • 1970-01-01
      • 2020-06-21
      • 1970-01-01
      • 1970-01-01
      • 2019-09-09
      • 1970-01-01
      • 2022-01-25
      相关资源
      最近更新 更多