【问题标题】:Multiple Entity recognition with Spacy python ErrorSpacy python错误的多实体识别
【发布时间】:2020-05-12 00:42:09
【问题描述】:

我遇到了一个问题并寻求您的帮助。我正在尝试使用 spacy 训练多个实体

以下是我的火车数据

response =[
('java developer with java and html css javascript ',
{'entities': [(0, 14, 'jobtitle'),
(0 , 4, 'skills'),
(34,37,'skills'),
(38, 49, 'skills')
]
}),
('looking for software engineer with java python',
{
'entities': [
(12, 29, 'jobtitle'),
(40, 46, 'skills'),
(35,39,"skills")
]
})
]

这是我有问题的火车代码

        nlp = spacy.blank("en")
        optimizer = nlp.begin_training()
        for i in range(20):
            random.shuffle(TRAIN_DATA)
            for text, annotations in TRAIN_DATA:
                nlp.update([text], [annotations], sgd=optimizer)

错误: ValueError: [E103] 试图设置冲突的 doc.ents: '(0, 14, 'jobtitle')' 和 '(0, 4, 'skills')'。令牌只能是一个实体的一部分,因此请确保您设置的实体不重叠。

【问题讨论】:

    标签: python-3.x nlp spacy spacy-transformers


    【解决方案1】:

    正如错误消息所述,spacy 的 NER 模型不支持重叠实体跨度,因此您无法使用这些注释训练模型。

    【讨论】:

    • 未来有支持他们的计划吗?
    猜你喜欢
    • 2023-03-24
    • 2021-05-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-02-01
    相关资源
    最近更新 更多