【发布时间】:2016-06-16 14:18:52
【问题描述】:
在doc2vec function中,有一个参数叫size。
我知道size是输出向量的维度,如果size=400会比size=100更好地捕捉内容。
但是,我不明白,size 代表什么?这是否意味着 Doc2Vec 将从一个单词中查找多远,以预测下一个单词?或者是什么意思?
非常感谢,
【问题讨论】:
在doc2vec function中,有一个参数叫size。
我知道size是输出向量的维度,如果size=400会比size=100更好地捕捉内容。
但是,我不明白,size 代表什么?这是否意味着 Doc2Vec 将从一个单词中查找多远,以预测下一个单词?或者是什么意思?
非常感谢,
【问题讨论】:
size 是创建的向量中的维数。所以size=100 表示每个文档(实际上是文档标签)从训练中接收一个 100 维向量。
更多维度并不总是更好:它们意味着更慢的训练和更大的模型。如果你正在处理一个小数据集,太多的维度可能会导致过度拟合——阻止模型表示数据中的可概括模式。
【讨论】: