【发布时间】:2022-01-07 17:06:16
【问题描述】:
为什么损失函数在第一个 epoch 之后总是打印零?
我怀疑是因为loss = loss_fn(outputs, torch.max(labels, 1)[1])。
但是如果我使用loss = loss_fn(outputs, labels),我会得到错误
RuntimeError: 0D or 1D target tensor expected, multi-target not supported
.
nepochs = 5
losses = np.zeros(nepochs)
loss_fn = nn.CrossEntropyLoss()
optimizer = optim.Adam(modell.parameters(), lr = 0.001)
for epoch in range(nepochs):
running_loss = 0.0
n = 0
for data in train_loader:
#single batch
if(n == 1):
break;
inputs, labels = data
optimizer.zero_grad()
outputs = modell(inputs)
#loss = loss_fn(outputs, labels)
loss = loss_fn(outputs, torch.max(labels, 1)[1])
loss.backward()
optimizer.step()
running_loss += loss.item()
n += 1
losses[epoch] = running_loss / n
print(f"epoch: {epoch+1} loss: {losses[epoch] : .3f}")
型号是:
def __init__(self, labels=10):
super(Classifier, self).__init__()
self.fc = nn.Linear(3 * 64 * 64, labels)
def forward(self, x):
out = x.reshape(x.size(0), -1)
out = self.fc (out)
return out
有什么想法吗?
标签是一个 64 个元素的张量,如下所示:
tensor([[7],[1],[ 2],[3],[ 2],[9],[9],[8],[9],[8],[ 1],[7],[9],[2],[ 5],[1],[3],[3],[8],[3],[7],[1],[7],[9],[8],[ 8],[3],[7],[ 5],[ 1],[7],[3],[2],[1],[ 3],[3],[2],[0],[3],[4],[0],[7],[1],[ 8],[4],[1],[ 5],[ 3],[4],[3],[ 4],[8],[4],[1],[ 9],[7],[3],[ 2],[ 6],[4],[ 8],[3],[ 7],[3]])
【问题讨论】:
-
取决于
labels包含的内容。请提供minimal reproducible example。 -
@GoodDeeds,标签是一个有 64 个元素的张量,每个标签的 ID。我在问题中添加了一个示例。
-
我觉得loss应该是
loss = loss_fn(outputs, torch.max(labels, 1)[0]) -
那行得通@yakhyo!谢谢!
-
@jimmy,我更新了答案。我想我在评论中犯了一个小错误。
标签: python pytorch conv-neural-network