如何在 pytorch 中更改输入图片的尺寸？答案

【问题标题】：How do you change the dimension of your input pictures in pytorch?如何在 pytorch 中更改输入图片的尺寸？
【发布时间】：2019-05-20 00:16:58
【问题描述】：

我制作了一个卷积神经网络，我希望它获取输入图片和输出图片，但是当我将图片转换为张量时，它们的维度错误：

RuntimeError: Expected 4-dimensional input for 4-dimensional weight [20, 3, 5, 5], but got 3-dimensional input of size [900, 1440, 3] instead

如何更改图片的尺寸？为什么需要改变？以及如何使输出成为图片？我尝试使用

transform = transforms.Compose(
[transforms.ToTensor(),
 transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

对 img 进行规范化，但它没有改变尺寸。这是我的神经网络

    def __init__(self):
    super(Net, self).__init__()
    torch.nn.Module.dump_patches = True
    self.conv1 = nn.Conv2d(3, 20, 5)
    self.pool = nn.MaxPool2d(2, 2)
    self.conv2 = nn.Conv2d(20, 16, 5)
    self.fc1 = nn.Linear(16*5*5, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 16*5*5)


def forward(self, x):
    x = self.pool(F.relu(self.conv1(x)))
    x = self.pool(F.relu(self.conv2(x)))
    x = x.view(-1, 16 * 5 )
    x = F.relu(self.fc1(x))
    x = F.relu(self.fc2(x))
    x = self.fc3(x)


    return x

我在这里获取图像并将其放入列表中：

for i in range(4):
l.append(ImageGrab.grab())

这是将 img 转换为张量的代码

k=torch.from_numpy(np.asarray(l[1],dtype="int32" ))

【问题讨论】：

torch.nn 仅支持小批量。输入的格式应为（batch_size、channels、height、width）。您似乎缺少批处理维度。添加.unsqueeze(0) 以添加假批量维度。
我改变了它，现在我得到了错误RuntimeError: Given groups=1, weight of size [20, 3, 5, 5], expected input[1, 900, 1440, 3] to have 3 channels, but got 900 channels instead
我在解压之前通过转换来修复它，但现在我得到了错误 ` x = x.view(-1, 16 * 5 *5) RuntimeError: shape '[-1, 400]' is invalid对于大小为 1268064` 的输入，我猜这是 convelution 中的一个错误，所以谢谢你帮助我

标签： python-3.x multidimensional-array python-imaging-library conv-neural-network pytorch

【解决方案1】：

综上，根据你我发的cmets：

错误是由于torch.nn 仅支持小批量。输入的格式应为(batch_size, channels, height, width)。您似乎缺少批处理维度。可以添加.unsqueeze(0)，在首位添加一个假的批量维度。

除上述之外，您还必须将图像的尺寸从[HxWxC] 重新排列为[CxHxW]。这是通过 PyTorch 中的.ToTensor() 转换完成的。

对于输入图像的大小不匹配问题，您可以像这样使用转换：

transform = transforms.Compose(
                   [transforms.Resize((32,32)),
                    transforms.ToTensor(),
                    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

【讨论】：

谢谢它的工作，但现在我希望 nn 中的输出也是一张图片，我将如何更改 nn 来完成它？
我没有得到你的问题。您想在图片旁边显示模型预测的标签吗？你可以从这个官方教程中检查imshow函数：pytorch.org/tutorials/beginner/…
我不希望它预测标签，但我希望它预测图片我希望输出类似于输入，因此我将输入转换回图像，但我不知道该怎么做.
神经网络只能输出标签，除非您使用一些高级网络进行图像生成，例如 GAN（生成模型）。据我从你的问题中了解到，神经网络会给你不同类别的概率，然后你可以找到概率最高的类别。现在，您可以绘制与该标签对应的任何图像，而不是显示类本身。