【问题标题】:Training SVM classifier (word embeddings vs. sentence embeddings)训练 SVM 分类器(词嵌入与句子嵌入)
【发布时间】:2021-09-14 09:42:30
【问题描述】:

我想尝试不同的嵌入,例如 Word2Vec、ELMo 和 BERT,但我有点困惑是使用词嵌入还是句子嵌入,以及为什么。我将嵌入用作 SVM 分类器的特征输入。

谢谢。

【问题讨论】:

    标签: svm word2vec bert-language-model word-embedding elmo


    【解决方案1】:

    虽然这两种方法对于不同的数据集都证明是有效的,但根据经验,我建议您在输入是几个单词时使用词嵌入,而在输入较长(例如大段落)时使用句子嵌入。

    【讨论】:

    • 感谢您的回答。如果我使用词嵌入,每个输入的长度都会不同,我应该用零填充它们吗?
    • 它并不完全以这种方式工作,对于我所知道的大多数词嵌入系统,您将可能的词的总数定义为输入维度。参见这个例子。 https://github.com/Eligijus112/word-embedding-creation/blob/master/master.py#L51
    猜你喜欢
    • 2019-11-26
    • 2019-12-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-07-11
    • 1970-01-01
    相关资源
    最近更新 更多