【发布时间】:2018-09-02 05:15:24
【问题描述】:
我成功地遵循了关于 Word2Vec 的 deeplearning4j.org 教程,因此我能够加载已经训练的模型或基于一些原始文本训练一个新模型(更具体地说,我使用的是 GoogleNews-vectors-negative300 和 Emoji2Vec 预训练模型)。
但是,我想将上述两个模型结合起来,原因如下:有一个句子(例如,来自 Instagram 或 Twitter 的评论,由 emoji 组成),我想识别句子中的 emoji,然后将其映射到与之相关的单词。为了做到这一点,我打算遍历句子中的所有单词并计算接近度(表情符号和单词在向量空间中的距离)。
我found the code 如何提升现有模型。但是,提到在这种情况下不会添加新单词,并且只会根据新的文本语料库更新现有单词的权重。
对于我遇到的问题,如果有任何帮助或想法,我将不胜感激。提前致谢!
【问题讨论】:
-
欢迎加入 gitter 上的 DL4J 开发支持社区:gitter.im/deeplearning4j/deeplearning4j
-
谢谢!我加入了 Gitter 社区,然而,还没有人能回答我的问题。也许我需要重组它。
标签: java nlp emoji word2vec deeplearning4j