【问题标题】:SpaCy NER differentiating numbers or entitiesSpaCy NER 区分数字或实体
【发布时间】:2020-02-06 07:40:39
【问题描述】:

我目前正在使用 SpaCy NER,想知道 SpaCy NER 是否可以做以下两件事:

案例 1

假设我们有 2 个句子要进行 NER:

  1. 他体内的糖含量正在增加。
  2. 他的整体健康质量正在提高。

我们能否将第一句中的“increasing”标记为“症状”实体,将第二句中的“increasing”标记为“good result”实体? NER 会看到这 2 个“增加”的词的区别吗?

案例 2

我们还有两个不同的句子:

  1. 我的工资是每月 8000 美元
  2. 我的支出是每月 5000 美元

NER 能否将第一句中的数字视为“收入”实体,将第二句中的数字视为“支出”?

谢谢

【问题讨论】:

    标签: machine-learning nlp spacy named-entity-recognition


    【解决方案1】:

    这些任务超出了您期望 NER 模型能够以多种方式完成的任务。 Spacy 的 NER 算法可用于查找实体类型,例如 MONEY(这是其英语模型中的实体类型)或类似 SYMPTOM 的实体类型,但它并没有考虑到非常大的上下文来检测/分类实体,因此它无法区分相关上下文相当远的这些情况。

    您可能希望将 NER(或其他类型的相关跨度检测,也可以是基于规则的)与另一种更侧重于上下文的分析相结合。这可能是某种文本分类,您可以检查依赖解析等。

    这是 spacy 文档中关于使用 NER 提取实体关系的一个简单示例(查找 MONEY),然后检查依赖项解析以尝试找出 money 元素可能指的是什么:

    https://spacy.io/usage/examples#entity-relations

    【讨论】:

    • 谢谢!基于 BERT 或双向 LSTM-CNN 的 NER 能做到这一点吗?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-27
    • 1970-01-01
    • 1970-01-01
    • 2023-02-02
    相关资源
    最近更新 更多