【发布时间】:2018-05-31 18:55:47
【问题描述】:
Embedding PyTorch 中的层列在“稀疏层”下,但有以下限制:
请记住,只有少数优化器支持稀疏梯度:目前是 optim.SGD(cuda 和 cpu)和 optim.Adagrad(cpu)
这是什么原因?例如,在 Keras 中,我可以使用任何优化器来训练带有嵌入层的架构。
【问题讨论】:
-
最好在PyTorch forum问这样的问题。
-
好主意!太好了,以至于我在搜索 PyTorch 论坛后立即能够回答我的问题!
-
你的回答并没有真正回答你的问题,即为什么嵌入被实现为稀疏层。
-
好点。我会看看我是否能弄清楚并更新我的答案。
标签: neural-network deep-learning pytorch