【问题标题】:Do I still need to load word2vec model at model testing?我还需要在模型测试时加载 word2vec 模型吗?
【发布时间】:2017-06-13 07:11:51
【问题描述】:

这听起来像是一个幼稚的问题,但我对此很陌生。假设我使用 Google 预训练的 word2vector 模型 (https://github.com/dav/word2vec) 来训练分类模型。我保存了我的分类模型。现在我将分类模型加载回内存以测试新实例。我需要再次加载 Google word2vector 模型吗?还是仅用于训练我的模型?

【问题讨论】:

    标签: machine-learning word2vec


    【解决方案1】:

    这取决于您的语料库和测试示例的结构和预处理方式。

    您可能正在使用预训练的词向量将文本转换为数字特征。首先,文本示例被向量化以训练分类器。稍后,其他(测试/生产)文本示例将在相同的情况下进行矢量化,并呈现给分类器以获取其判断。

    因此,您需要对测试/生产文本示例使用与训练期间使用的相同的文本到向量流程。也许您已经在之前的单独批量步骤中完成了该操作,在这种情况下,您已经拥有分类器使用的向量形式的特征。但通常你的分类器管道本身会获取原始文本,并将其矢量化——在这种情况下,它需要与训练期间可用的相同的预训练 (word)->(vector) 映射在测试时可用。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-01-16
      • 2017-10-07
      • 2017-03-10
      • 2017-08-16
      • 1970-01-01
      • 1970-01-01
      • 2019-09-17
      • 2017-09-01
      相关资源
      最近更新 更多