【发布时间】:2018-09-19 09:13:03
【问题描述】:
我有一个关于运行 Spark MLlib 的 word2vec 的问题。 我以~2.4M 的词汇量和~1.4B 的语料库运行它。 获得某些单词的 +-infinity 向量的原因是什么? 当我增加迭代次数时会发生这种情况,即通过 10 次迭代我得到一个合理的模型, 并且通过 20 次迭代,我得到了一些 [Infinity,-Infinity,Infinity,-Infinity,...] 形式的向量。提前致谢。
【问题讨论】:
标签: apache-spark word2vec