【问题标题】:What does it mean for the shape of an image tensor to be (64, 64)? Does that mean there are no channels?图像张量的形状为 (64, 64) 意味着什么?这是否意味着没有渠道?
【发布时间】:2020-07-08 13:13:08
【问题描述】:

我正在探索数据集的图像:Tiny Imagenet,我发现大多数图像张量具有形状(64、64、3),即高度和宽度分别为 64 和 64 的图像以及红色、绿色的三个通道和蓝色。但是数据集中的一些图像张量具有形状 (64, 64)。

这是否意味着没有渠道?怎么可能?

编辑 - 我下载了张量形状 (64, 64) 的这张图片:

编辑 - 它是否有可能像 Lab 一样具有其他颜色空间的一个通道? (这里的 b 指的是从蓝色到黄色的颜色)。

【问题讨论】:

    标签: tensorflow deep-learning computer-vision pytorch tensor


    【解决方案1】:

    通常,它等价于 (64, 64, 1) 但大多数库会折叠最后一个轴。这意味着您只有一个通道,可能是灰度图像。您的数据集是否可能混合在 RGB 和灰度图像之间?

    【讨论】:

    • 图像看起来不是灰度的,是否可能在其他颜色空间(例如 Lab)中具有一维?只有“b”部分(似乎从蓝色变为黄色)?
    • 你用matplotlib画了吗?可以在imshow中传入cmap='gray',以灰度显示。
    • 是的,我用过 matplotlib。实际上我只是为了可视化和分析图像而绘制它,因为我需要用它来训练机器学习模型。因此,以灰度显示图像是没有用的。
    【解决方案2】:

    你有一个通道维度 - 只有它是 shape=1 - 你有一个单一的颜色通道,这意味着这是一个灰度图像。

    如果你使用PIL.Image来读取图片,你可以通过以下方式强制它拥有三个通道

    Image.open(filename).convert('RGB')
    

    您将拥有 (64, 64, 3) 的 shape,但请注意所有频道都是相同的。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-08-20
      • 1970-01-01
      • 2019-10-04
      • 2023-03-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多