【问题标题】:What does size parameter in gensim doc2vec representgensim doc2vec中的size参数代表什么
【发布时间】:2016-06-16 14:18:52
【问题描述】:

doc2vec function中,有一个参数叫size

我知道size是输出向量的维度,如果size=400会比size=100更好地捕捉内容。

但是,我不明白,size 代表什么?这是否意味着 Doc2Vec 将从一个单词中查找多远,以预测下一个单词?或者是什么意思?

非常感谢,

【问题讨论】:

    标签: gensim doc2vec


    【解决方案1】:

    size 是创建的向量中的维数。所以size=100 表示每个文档(实际上是文档标签)从训练中接收一个 100 维向量。

    更多维度并不总是更好:它们意味着更慢的训练和更大的模型。如果你正在处理一个小数据集,太多的维度可能会导致过度拟合——阻止模型表示数据中的可概括模式。

    【讨论】:

      猜你喜欢
      • 2017-02-12
      • 2016-06-07
      • 1970-01-01
      • 2018-07-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-07-14
      相关资源
      最近更新 更多