【发布时间】:2017-10-02 18:49:02
【问题描述】:
我正在尝试使用相似性(可能是余弦)对一些句子进行聚类,然后可能使用分类器将文本放入预定义的类中。
我的想法是使用 tensorflow 生成词嵌入,然后对每个句子进行平均。接下来使用聚类/分类算法。
tensorflow 是否提供现成的 word2vec 生成算法?
词袋模型会产生好的输出吗?
【问题讨论】:
标签: tensorflow nlp word2vec text-classification
我正在尝试使用相似性(可能是余弦)对一些句子进行聚类,然后可能使用分类器将文本放入预定义的类中。
我的想法是使用 tensorflow 生成词嵌入,然后对每个句子进行平均。接下来使用聚类/分类算法。
tensorflow 是否提供现成的 word2vec 生成算法?
词袋模型会产生好的输出吗?
【问题讨论】:
标签: tensorflow nlp word2vec text-classification
否,tensorflow 不提供即用型 word2vec,但它确实有 a tutorial on word2vec。
是的,一袋词可以产生出奇的好输出(但不是state-of-the-art),并且具有以下优点: strong>惊人的快。我有少量数据(几万个句子),分类F1分数>0.90。
【讨论】: