预期目标大小 (50, 88)，得到 torch.Size([50, 288, 88])答案

【问题标题】：Expected target size (50, 88), got torch.Size([50, 288, 88])预期目标大小 (50, 88)，得到 torch.Size([50, 288, 88])
【发布时间】：2019-10-08 03:58:55
【问题描述】：

我正在尝试训练我的神经网络。在模型中训练是正确的，但我无法计算损失。输出和目标具有相同的维度。

我曾尝试使用 torch.stack，但我不能，因为每个输入的大小是 (252, x)，其中 x 在 252 个元素中是相同的，但对于其他输入不同。

我使用自定义数据集：

class MusicDataSet(Dataset):
def __init__(self, transform=None):
    self.ms, self.target, self.tam = sd.cargarDatos()  
    self.mean, self.std = self.NormalizationValues()                    
def __len__(self):
    return self.tam

def __getitem__(self, idx):
    #Normalize
    inp = (self.ms[idx]-self.mean)/self.std
    inp = torch.from_numpy(inp).float()    
    inp = inp.t()
    inp = inp.to('cuda')

    target= torch.from_numpy(self.target[idx])
    target = target.long()
    target = target.t()
    target = target.to('cuda')

    return inp, target

我必须说这个列表不能用类似的东西投射：target = torch.Tensor() 或 torch.stack() 因为这个 (252, x)，正如我已经说过的那样。

def music_collate_fn(batch):
    data = [item[0] for item in batch]
    data = pad_sequence(data, batch_first=True)
    target = [item[0] for item in batch]
    target = pad_sequence(target, batch_first=True)
    return data, target


musicSet = mds.MusicDataSet()
train_loader = torch.utils.data.DataLoader(musicSet,batch_size=50, collate_fn = music_collate_fn, shuffle=False)

input_dim = 252
hidden_dim = (512,1024,512)
output_dim = 88
mlp = rn.MLP(input_dim, hidden_dim, output_dim).to(device)

optimizer = torch.optim.RMSprop(mlp.parameters(), lr = learning_rate)
criterion = nn.CrossEntropyLoss()
for batch_idx, (x,y) in enumerate(train_loader):
    outputs = mlp(x.to(device))
    loss = criterion(outputs, y)
    optimizer.zero_grad()           
    loss.backward()                 
    optimizer.step()

输出和目标的大小是一样的，

output: torch.Size([50, 288, 88])
target:  torch.Size([50, 288, 88])

但是当我尝试计算损失时出现下一个错误：

  File "<ipython-input-205-3c47d7aa11a4>", line 32, in <module>
    loss = criterion(outputs, y)

  File "C:\ProgramData\Anaconda3\lib\site-packages\torch\nn\modules\module.py", line 489, in __call__
    result = self.forward(*input, **kwargs)

  File "C:\ProgramData\Anaconda3\lib\site-packages\torch\nn\modules\loss.py", line 904, in forward
    ignore_index=self.ignore_index, reduction=self.reduction)

  File "C:\ProgramData\Anaconda3\lib\site-packages\torch\nn\functional.py", line 1970, in cross_entropy
    return nll_loss(log_softmax(input, 1), target, weight, None, ignore_index, None, reduction)

  File "C:\ProgramData\Anaconda3\lib\site-packages\torch
\nn\functional.py", line 1800, in nll_loss
    out_size, target.size()))

ValueError: Expected target size (50, 88), got torch.Size([50, 288, 88])

【问题讨论】：

您的问题对我来说不是很清楚，但我敢打赌，您在进行培训时会混淆批量大小。
我模型的输入是 [batch_size,input, variableData]。目标的形状为 [batch_size, variabledata, target]。我尝试使用 torch.transpose(1,2) 将 variableData 放在目标位置，但它不起作用。
@LeonLopez CrossEntropyLoss 需要 (minibatch, C) 作为输入，其中 C 是类分类的数量。我需要确定您要执行什么任务才能提出（1）更改形状或（2）更改损失函数的建议。

标签： python pytorch loss-function

【解决方案1】：

我认为您错误地使用了CrossEntropyLoss。请参阅文档here。

特别是，如果输入的形状为 [NxCxd]，则目标的形状应为 [Nxd]，并且目标中的值是 0 到 C-1 之间的整数，即您可以只提供类标签，这不是必需的对目标变量进行 one-hot 编码。错误消息也说明了这一点。

【讨论】：