【发布时间】:2016-07-26 07:34:10
【问题描述】:
我正在尝试使用大小为 50 mb 的数据来训练我的模型。 我只是想知道是否有确定算法维度大小的规则/算法。
【问题讨论】:
标签: dimension training-data word2vec
我正在尝试使用大小为 50 mb 的数据来训练我的模型。 我只是想知道是否有确定算法维度大小的规则/算法。
【问题讨论】:
标签: dimension training-data word2vec
我假设一个 50mb 的文本文件大约有 500,000 个句子或 500 万个标记。 训练有意义的嵌入太小了,但是这里是您可以参考的经验数据(在 60 亿个令牌上训练)。
【讨论】: