【问题标题】:Extracting Dead Name Entities from Obituaries - NLP从讣告中提取死名实体 - NLP
【发布时间】:2013-10-09 10:10:53
【问题描述】:

我有一连串的广告,这些广告是从某份报纸中提取的。广告可能以如下格式显示:我的任务是提取死者的姓名。

John, the small son of Mr. and Mrs.<br>
Elmer Cleppfer, died at their home in<br>
Lewistown on Wednesday. The funeral<br>
will He held on Saturday afternoon<br>
from the home of the grandparents<br>
on the child, Mr. and Mrs. John<br>
Kiopper, 224 Locust street, tortiorrow<br>
afternoon at 2 o'clock. Interment witt<br>
take place at Oberlin.<br>

Mrs. Lydia Mintch, aged 6S years <br>
died yesterday afternoon at the home<br>
of Fred Flowerfleld at Enhaut. Mrs.<br>
Mlnlch contracted a severe attack of<br>
pneumonia aggravated by other illness<br>
Several days ago which resulted in her<br>
death. Funeral arrangements have not<br>
yet been completed.<br>

整个段落由2个广告组成。如果有超过1个这样的广告,谁能告诉我如何将这种文本分类成段落?

【问题讨论】:

  • 您的问题标题不符合您的要求。改变它

标签: nlp nltk stanford-nlp text-processing named-entity-recognition


【解决方案1】:

Stanford Parser 是您的选择。

  1. 首先仅提取包含死亡、减少或与这些术语相关的内容的句子。
  2. 使用 Stanford Parser 为这些句子生成折叠的类型依赖项。
  3. 您会找到一个模式,它可以帮助您获得减少的人的姓名。

我故意不在这里给出你应该放的模式 在你的努力中。

【讨论】:

    【解决方案2】:

    这是我解决问题的方法。

    1. 获取句子 POS 标记。
    2. 对于每个句子,深度解析并创建主-动词-宾语模型。 (从左到右解析)。
    3. 只要动词指向死亡,主语就是死者。

    【讨论】:

      猜你喜欢
      • 2017-11-29
      • 1970-01-01
      • 2018-08-29
      • 1970-01-01
      • 1970-01-01
      • 2018-03-08
      • 2020-07-02
      • 1970-01-01
      • 2017-10-14
      相关资源
      最近更新 更多