【发布时间】:2019-10-14 10:28:37
【问题描述】:
所以我有一个 RNN 编码器,它是更大语言模型的一部分,其过程是编码 -> rnn -> 解码。
作为我的 rnn 课程的__init__ 的一部分,我有以下内容:
self.encode_this = nn.Embedding(self.vocab_size, self.embedded_vocab_dim)
现在我正在尝试实现一个转发类,它接收批量并执行编码然后解码,
def f_calc(self, batch):
#Here, batch.shape[0] is the size of batch while batch.shape[1] is the sequence length
hidden_states = (torch.zeros(self.num_layers, batch.shape[0], self.hidden_vocab_dim).to(device))
embedded_states = (torch.zeros(batch.shape[0],batch.shape[1], self.embedded_vocab_dim).to(device))
o1, h = self.encode_this(embedded_states)
但是,我的问题总是与编码器有关,这给了我以下错误:
/usr/local/lib/python3.6/dist-packages/torch/nn/functional.py in embedding(input, weight, padding_idx, max_norm, norm_type, scale_grad_by_freq, sparse)
1465 # remove once script supports set_grad_enabled
1466 _no_grad_embedding_renorm_(weight, input, max_norm, norm_type)
-> 1467 return torch.embedding(weight, input, padding_idx, scale_grad_by_freq, sparse)
1468
1469
RuntimeError: Expected tensor for argument #1 'indices' to have scalar type Long; but got torch.cuda.FloatTensor instead (while checking arguments for embedding)
有人知道如何解决吗?我对pytorch完全陌生,所以如果这是一个愚蠢的问题,请原谅。我知道涉及到某种形式的类型转换,但我不知道该怎么做...
非常感谢!
【问题讨论】:
标签: python pytorch recurrent-neural-network