【问题标题】:Expected target size (50, 88), got torch.Size([50, 288, 88])预期目标大小 (50, 88),得到 torch.Size([50, 288, 88])
【发布时间】:2019-10-08 03:58:55
【问题描述】:

我正在尝试训练我的神经网络。在模型中训练是正确的,但我无法计算损失。输出和目标具有相同的维度。

我曾尝试使用 torch.stack,但我不能,因为每个输入的大小是 (252, x),其中 x 在 252 个元素中是相同的,但对于其他输入不同。

我使用自定义数据集:

class MusicDataSet(Dataset):
def __init__(self, transform=None):
    self.ms, self.target, self.tam = sd.cargarDatos()  
    self.mean, self.std = self.NormalizationValues()                    
def __len__(self):
    return self.tam

def __getitem__(self, idx):
    #Normalize
    inp = (self.ms[idx]-self.mean)/self.std
    inp = torch.from_numpy(inp).float()    
    inp = inp.t()
    inp = inp.to('cuda')

    target= torch.from_numpy(self.target[idx])
    target = target.long()
    target = target.t()
    target = target.to('cuda')

    return inp, target

我必须说这个列表不能用类似的东西投射:target = torch.Tensor() 或 torch.stack() 因为这个 (252, x),正如我已经说过的那样。

def music_collate_fn(batch):
    data = [item[0] for item in batch]
    data = pad_sequence(data, batch_first=True)
    target = [item[0] for item in batch]
    target = pad_sequence(target, batch_first=True)
    return data, target


musicSet = mds.MusicDataSet()
train_loader = torch.utils.data.DataLoader(musicSet,batch_size=50, collate_fn = music_collate_fn, shuffle=False)

input_dim = 252
hidden_dim = (512,1024,512)
output_dim = 88
mlp = rn.MLP(input_dim, hidden_dim, output_dim).to(device)

optimizer = torch.optim.RMSprop(mlp.parameters(), lr = learning_rate)
criterion = nn.CrossEntropyLoss()
for batch_idx, (x,y) in enumerate(train_loader):
    outputs = mlp(x.to(device))
    loss = criterion(outputs, y)
    optimizer.zero_grad()           
    loss.backward()                 
    optimizer.step()

输出和目标的大小是一样的,

output: torch.Size([50, 288, 88])
target:  torch.Size([50, 288, 88])

但是当我尝试计算损失时出现下一个错误:

  File "<ipython-input-205-3c47d7aa11a4>", line 32, in <module>
    loss = criterion(outputs, y)

  File "C:\ProgramData\Anaconda3\lib\site-packages\torch\nn\modules\module.py", line 489, in __call__
    result = self.forward(*input, **kwargs)

  File "C:\ProgramData\Anaconda3\lib\site-packages\torch\nn\modules\loss.py", line 904, in forward
    ignore_index=self.ignore_index, reduction=self.reduction)

  File "C:\ProgramData\Anaconda3\lib\site-packages\torch\nn\functional.py", line 1970, in cross_entropy
    return nll_loss(log_softmax(input, 1), target, weight, None, ignore_index, None, reduction)

  File "C:\ProgramData\Anaconda3\lib\site-packages\torch
\nn\functional.py", line 1800, in nll_loss
    out_size, target.size()))

ValueError: Expected target size (50, 88), got torch.Size([50, 288, 88])

【问题讨论】:

  • 您的问题对我来说不是很清楚,但我敢打赌,您在进行培训时会混淆批量大小。
  • 我模型的输入是 [batch_size,input, variableData]。目标的形状为 [batch_size, variabledata, target]。我尝试使用 torch.transpose(1,2) 将 variableData 放在目标位置,但它不起作用。
  • @LeonLopez CrossEntropyLoss 需要 (minibatch, C) 作为输入,其中 C 是类分类的数量。我需要确定您要执行什么任务才能提出(1)更改形状或(2)更改损失函数的建议。

标签: python pytorch loss-function


【解决方案1】:

我认为您错误地使用了CrossEntropyLoss。请参阅文档here

特别是,如果输入的形状为 [NxCxd],则目标的形状应为 [Nxd],并且目标中的值是 0 到 C-1 之间的整数,即您可以只提供类标签,这不是必需的对目标变量进行 one-hot 编码。错误消息也说明了这一点。

【讨论】:

    猜你喜欢
    • 2019-07-19
    • 1970-01-01
    • 1970-01-01
    • 2012-07-22
    • 2021-10-30
    • 1970-01-01
    • 2020-07-05
    • 2021-05-09
    • 1970-01-01
    相关资源
    最近更新 更多