在预训练的谷歌新闻向量上重新训练 word2vec

【问题标题】：Retraining of word2vec on the pretrained Google news vector在预训练的谷歌新闻向量上重新训练 word2vec
【发布时间】：2018-08-27 18:45:41
【问题描述】：

我正在进行一项实验，我想知道是否可以仅使用我想要的超参数来重新训练 word2vec Google 新闻向量。并将我想要的值分配给这些超参数。谢谢

【问题讨论】：

【解决方案1】：

不是真的，因为他们没有分享他们使用的确切语料库。

如果你更喜欢自己的语料库——因为它包含更多的单词，或者适合你的应用程序的词义，或者甚至只是因为它是你唯一的东西——你真的不需要“重新训练" 其他向量，您可以从头开始制作自己的向量。

可能有一些方法可以将这些向量注入到您的模型中以实现“快速启动”，但这会增加复杂性并带来不明确的好处。如果您的语料库有任何好处，甚至可能比用于 GoogleNews 的语料库更好，那么混合来自那里的影响可能会很复杂，但没有任何净收益。

【讨论】：