【发布时间】:2019-08-02 21:39:52
【问题描述】:
我是 DL 和 NLP 的新手,最近开始通过 gensim 使用预训练的 fastText 嵌入模型 (cc.en.300.bin)。
我希望能够自己计算词汇外单词的向量,方法是将单词拆分为 n-gram 并查找每个 n-gram 的向量。
我找不到导出模型一部分的 n-gram 向量的方法。我意识到它们是散列的,但也许有办法(不一定使用 gensim)来获取它们?
任何见解将不胜感激!
【问题讨论】:
标签: export gensim n-gram fasttext oov