【发布时间】:2017-09-08 10:33:31
【问题描述】:
我正在使用 stanford NLP 训练 自定义命名实体识别(NER) 模型,但问题是我想重新训练模型 .
示例:
假设我训练了 xyz 模型,那么如果模型检测到错误,我将在一些文本上对其进行测试,然后我(最终用户)将纠正它并想要重新训练(附加模式)模型更正后的文字。
Stanford 不提供重新训练设施,这就是为什么我转向 python 的 spacy 库,在那里我可以重新训练模型意味着,我可以附加新实体到现有模型中。但是在使用 spacy 重新训练模型后,它会覆盖现有知识(意味着其中的现有训练数据)并仅显示与最近训练相关的结果。
考虑,我使用 1000 条记录在 TECHNOLOGY 标签上训练了一个模型。之后可以说我在现有实体中添加了一个 BOOK_NAME训练有素的模型。在此之后,如果我测试模型,那么 spacy 模型只会从文本中检测 BOOK_NAME。
请提出解决我的问题陈述的建议。
在此先感谢...!
【问题讨论】:
标签: machine-learning stanford-nlp spacy