【发布时间】:2018-08-27 18:45:41
【问题描述】:
我正在进行一项实验,我想知道是否可以仅使用我想要的超参数来重新训练 word2vec Google 新闻向量。并将我想要的值分配给这些超参数。 谢谢
【问题讨论】:
标签: machine-learning nlp word2vec
我正在进行一项实验,我想知道是否可以仅使用我想要的超参数来重新训练 word2vec Google 新闻向量。并将我想要的值分配给这些超参数。 谢谢
【问题讨论】:
标签: machine-learning nlp word2vec
不是真的,因为他们没有分享他们使用的确切语料库。
如果你更喜欢自己的语料库——因为它包含更多的单词,或者适合你的应用程序的词义,或者甚至只是因为它是你唯一的东西——你真的不需要“重新训练" 其他向量,您可以从头开始制作自己的向量。
可能有一些方法可以将这些向量注入到您的模型中以实现“快速启动”,但这会增加复杂性并带来不明确的好处。如果您的语料库有任何好处,甚至可能比用于 GoogleNews 的语料库更好,那么混合来自那里的影响可能会很复杂,但没有任何净收益。
【讨论】: