【问题标题】:How do you change the dimension of your input pictures in pytorch?如何在 pytorch 中更改输入图片的尺寸?
【发布时间】:2019-05-20 00:16:58
【问题描述】:

我制作了一个卷积神经网络,我希望它获取输入图片和输出图片,但是当我将图片转换为张量时,它们的维度错误:

RuntimeError: Expected 4-dimensional input for 4-dimensional weight [20, 3, 5, 5], but got 3-dimensional input of size [900, 1440, 3] instead 

如何更改图片的尺寸?为什么需要改变? 以及如何使输出成为图片? 我尝试使用

transform = transforms.Compose(
[transforms.ToTensor(),
 transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

对 img 进行规范化,但它没有改变尺寸。 这是我的神经网络

    def __init__(self):
    super(Net, self).__init__()
    torch.nn.Module.dump_patches = True
    self.conv1 = nn.Conv2d(3, 20, 5)
    self.pool = nn.MaxPool2d(2, 2)
    self.conv2 = nn.Conv2d(20, 16, 5)
    self.fc1 = nn.Linear(16*5*5, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 16*5*5)


def forward(self, x):
    x = self.pool(F.relu(self.conv1(x)))
    x = self.pool(F.relu(self.conv2(x)))
    x = x.view(-1, 16 * 5 )
    x = F.relu(self.fc1(x))
    x = F.relu(self.fc2(x))
    x = self.fc3(x)


    return x

我在这里获取图像并将其放入列表中:

for i in range(4):
l.append(ImageGrab.grab())

这是将 img 转换为张量的代码

k=torch.from_numpy(np.asarray(l[1],dtype="int32" ))

【问题讨论】:

  • torch.nn 仅支持小批量。输入的格式应为(batch_size、channels、height、width)。您似乎缺少批处理维度。添加.unsqueeze(0) 以添加假批量维度。
  • 我改变了它,现在我得到了错误RuntimeError: Given groups=1, weight of size [20, 3, 5, 5], expected input[1, 900, 1440, 3] to have 3 channels, but got 900 channels instead
  • 我在解压之前通过转换来修复它,但现在我得到了错误 ` x = x.view(-1, 16 * 5 *5) RuntimeError: shape '[-1, 400]' is invalid对于大小为 1268064` 的输入,我猜这是 convelution 中的一个错误,所以谢谢你帮助我

标签: python-3.x multidimensional-array python-imaging-library conv-neural-network pytorch


【解决方案1】:

综上,根据你我发的cmets:

错误是由于torch.nn 仅支持小批量。输入的格式应为(batch_size, channels, height, width)。您似乎缺少批处理维度。可以添加.unsqueeze(0),在首位添加一个假的批量维度。

除上述之外,您还必须将图像的尺寸从[HxWxC] 重新排列为[CxHxW]。这是通过 PyTorch 中的.ToTensor() 转换完成的。

对于输入图像的大小不匹配问题,您可以像这样使用转换:

transform = transforms.Compose(
                   [transforms.Resize((32,32)),
                    transforms.ToTensor(),
                    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

【讨论】:

  • 谢谢它的工作,但现在我希望 nn 中的输出也是一张图片,我将如何更改 nn 来完成它?
  • 我没有得到你的问题。您想在图片旁边显示模型预测的标签吗?你可以从这个官方教程中检查imshow函数:pytorch.org/tutorials/beginner/…
  • 我不希望它预测标签,但我希望它预测图片我希望输出类似于输入,因此我将输入转换回图像,但我不知道该怎么做.
  • 神经网络只能输出标签,除非您使用一些高级网络进行图像生成,例如 GAN(生成模型)。据我从你的问题中了解到,神经网络会给你不同类别的概率,然后你可以找到概率最高的类别。现在,您可以绘制与该标签对应的任何图像,而不是显示类本身。
猜你喜欢
  • 2020-09-09
  • 2021-06-04
  • 1970-01-01
  • 2014-05-12
  • 2022-01-19
  • 2021-11-06
  • 2019-11-06
  • 2017-08-14
  • 1970-01-01
相关资源
最近更新 更多