【发布时间】:2020-05-06 17:28:11
【问题描述】:
如何进行迁移学习,即采用预训练的 Spacy NER 模型并使其学习特定于我的用例的新实体?
为此,我有 100 个新的带注释的训练样本。新的再训练模型应该只预测新实体,而不是预训练的 spacy 模型中的任何现有实体。只是在现有模型中添加/更新新实体并在预测期间忽略旧实体是没有意义的。
这个official example 描述了如何向现有的预训练实体添加新实体,但这不是我想要的。我也有很少的例子,即 100 个从头开始完全构建新的 NER 模型。
编辑:我想识别非结构化文档中的所有帐号。
示例 ("我想更改我的账户 12345 对应的地址。请告诉我怎么做。" [34, 39, 'accountnumber'])
【问题讨论】:
-
需要更多信息来回答这个问题 - 您正在使用什么类型的实体?地名、人名等?您能否举例说明新实体及其训练数据?
-
谢谢。已添加到帖子中
标签: python deep-learning nlp spacy named-entity-recognition