【发布时间】:2021-09-14 09:42:30
【问题描述】:
我想尝试不同的嵌入,例如 Word2Vec、ELMo 和 BERT,但我有点困惑是使用词嵌入还是句子嵌入,以及为什么。我将嵌入用作 SVM 分类器的特征输入。
谢谢。
【问题讨论】:
标签: svm word2vec bert-language-model word-embedding elmo
我想尝试不同的嵌入,例如 Word2Vec、ELMo 和 BERT,但我有点困惑是使用词嵌入还是句子嵌入,以及为什么。我将嵌入用作 SVM 分类器的特征输入。
谢谢。
【问题讨论】:
标签: svm word2vec bert-language-model word-embedding elmo
虽然这两种方法对于不同的数据集都证明是有效的,但根据经验,我建议您在输入是几个单词时使用词嵌入,而在输入较长(例如大段落)时使用句子嵌入。
【讨论】:
https://github.com/Eligijus112/word-embedding-creation/blob/master/master.py#L51