【发布时间】:2021-11-11 09:22:29
【问题描述】:
我正在尝试使用 entity_ruler 构建“命名实体”的自定义列表,同时遵循 APIs
但是我遇到了一个问题:我可以构建一个命名实体来引用另一个也在 entity_ruler 中定义的实体吗?
举个例子,假设我想将实体Agreement构建为一些固定表达式,并将实体AgreementDate构建为Agreement,后跟另一个表达式:
以下剪断可以正确设置spacy吗?因为输出不是我所期望的。
patterns = [
{'label': 'Agreement', 'pattern': [{'LOWER': 'license agreement'}]},
{'label': 'Agreement', 'pattern': [{'LOWER': 'agreement'}]},
{'label': 'Agreement', 'pattern': [{'LOWER': 'commencement'}]},
{'label': 'Agreement', 'pattern': [{'LOWER': 'parties'}]},
{'label': 'AgreementDate', 'pattern': [{'ENT_TYPE': 'Agreement'}, {'LOWER': 'date'}]},
]
nlp = spacy.load('en_core_web_sm')
entity_ruler = nlp.add_pipe('entity_ruler', config={
'validate': True,
'overwrite_ents': True
})
entity_ruler.initialize(lambda: [], nlp=nlp, patterns=patterns)
for ent in nlp('''Commencement Date
license agreement date''').ents:
print(f'{ent.text:40} {ent.label_:40}')
Commencement Agreement
agreement Agreement
【问题讨论】:
标签: spacy named-entity-recognition named-entity-extraction