【问题标题】:what should be the dimension of vectors for word2vec algorithm for 50 mb data50 mb 数据的 word2vec 算法的向量维数应该是多少
【发布时间】:2016-07-26 07:34:10
【问题描述】:

我正在尝试使用大小为 50 mb 的数据来训练我的模型。 我只是想知道是否有确定算法维度大小的规则/算法。

【问题讨论】:

标签: dimension training-data word2vec


【解决方案1】:

我假设一个 50mb 的文本文件大约有 500,000 个句子或 500 万个标记。 训练有意义的嵌入太小了,但是这里是您可以参考的经验数据(在 60 亿个令牌上训练)。

来源:https://nlp.stanford.edu/pubs/glove.pdf

【讨论】:

    猜你喜欢
    • 2018-04-12
    • 1970-01-01
    • 2018-04-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-04-29
    • 1970-01-01
    相关资源
    最近更新 更多