使用负采样实现 word2vec答案

【问题标题】：implementing word2vec with negative sampling使用负采样实现 word2vec
【发布时间】：2016-09-02 20:24:22
【问题描述】：

我正在尝试使用 skip-gram 实现 word2vec 的前向和反向传播。我是神经网络的新手，但据我了解，事情是这样的：

取输入向量和随机初始化权重矩阵的点积
激活（sigmoid 还是 softmax？）
对激活的隐藏层和另一个随机初始化权重矩阵进行点积
激活（sigmoid 还是 softmax？）
我们以某种方式比较第 4 步之后得到的输出，并计算误差（目标输出）相对于矩阵中每个权重的导数。我们从当前权重中减去导数。我们对输出隐藏层和隐藏输入层都这样做。我们这样做很多次，直到我们足够好。

如果上面有任何问题，请纠正我。

所以现在我的问题是：

谢谢。

【问题讨论】：

【解决方案1】：

我不知道它是否是您问题的答案，但它是为了完成您的问题（我确定！）。我不认为在第二步中我们使用 sigmoid 或 softmax 函数，因为第一个点项目仅用于从矩阵 W（第一个矩阵）中提取目标词的向量。请看这些：

这本书这一章的第 16.2 节，对我很有帮助 https://web.stanford.edu/~jurafsky/slp3/16.pdf

【讨论】：