【发布时间】:2019-03-11 14:35:35
【问题描述】:
我正在为三个标签(PER、ORG、LOC)做 NER 分类器。我正在根据 stanford crf 分类器检查我的结果。因此,我想知道 stanford crf 分类器评估部分是如何工作的。是考虑所有的 TAGS(PER、ORG、LOC、O)还是只考虑(PER、ORG、LOC)?
【问题讨论】:
标签: nlp stanford-nlp named-entity-recognition
我正在为三个标签(PER、ORG、LOC)做 NER 分类器。我正在根据 stanford crf 分类器检查我的结果。因此,我想知道 stanford crf 分类器评估部分是如何工作的。是考虑所有的 TAGS(PER、ORG、LOC、O)还是只考虑(PER、ORG、LOC)?
【问题讨论】:
标签: nlp stanford-nlp named-entity-recognition
基于提取实体的召回率和精度,得分为 F1。如果您有一个标记方案,例如(PER、ORG、LOC),那么一个实体就是一个具有相同标记的连续标记序列。请注意,带有O 标签的标记序列不被视为实体。
最终报告为所有实体提供 F1,并为每个实体类型提供 F1 分数。
另请注意,没有部分功劳。您要么正确找到实体,要么不正确。因此,在例句“Joe Smith 住在加利福尼亚。”中,“Joe”和“Smith”都必须标记为 PERSON 才能正确找到 PERSON 实体。如果仅将“Joe”标记为 PERSON(并且将“Smith”标记为 O),您将获得 0 分正确的 PERSON 实体和 1 不正确的 PERSON 实体。
【讨论】: