【问题标题】:Retraining of word2vec on the pretrained Google news vector在预训练的谷歌新闻向量上重新训练 word2vec
【发布时间】:2018-08-27 18:45:41
【问题描述】:

我正在进行一项实验,我想知道是否可以仅使用我想要的超参数来重新训练 word2vec Google 新闻向量。并将我想要的值分配给这些超参数。 谢谢

【问题讨论】:

标签: machine-learning nlp word2vec


【解决方案1】:

不是真的,因为他们没有分享他们使用的确切语料库。

如果你更喜欢自己的语料库——因为它包含更多的单词,或者适合你的应用程序的词义,或者甚至只是因为它是你唯一的东西——你真的不需要“重新训练" 其他向量,您可以从头开始制作自己的向量。

可能有一些方法可以将这些向量注入到您的模型中以实现“快速启动”,但这会增加复杂性并带来不明确的好处。如果您的语料库有任何好处,甚至可能比用于 GoogleNews 的语料库更好,那么混合来自那里的影响可能会很复杂,但没有任何净收益。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-01-03
    • 2023-01-03
    • 1970-01-01
    • 2017-03-28
    • 2017-12-15
    • 2015-06-17
    • 2020-05-12
    相关资源
    最近更新 更多