【发布时间】:2023-03-13 05:54:01
【问题描述】:
我正在训练一个 allennlp crf_tagger。我正在使用一个基于 SentenceTaggerPredictor。问题在于分词器参数 - 在 SentenceTaggerPredictor 的情况下,有一个语言参数。
由于 SentenceTaggerPredictor 有 language="en_core_web_sm" 作为默认参数,所以当我这样做时
Predictor.from_path("model.tar.gz", "sentence_tagger")
分词器是使用默认语言创建的。但是,如果使用不同的语言对训练数据进行标记,会发生什么情况。如何为模型 config.json 中的预测器指定参数,以便使用非默认语言构造 Predictor.from_path?
【问题讨论】:
标签: prediction allennlp