【问题标题】:How can one resolve synonyms in named-entity recognition?如何解决命名实体识别中的同义词?
【发布时间】:2013-04-05 13:43:41
【问题描述】:

在自然语言处理中,命名实体识别是识别命名实体(例如组织、地点,最重要的是名称)的挑战。

虽然我称之为同义词,但其中有一个重大挑战:伯爵德古拉实际上指的是同一个人,但可能从未在文本中直接讨论过。

解析这些同义词的最佳算法是什么?


如果任何基于 Python 的库中都有这方面的功能,我渴望接受教育。我正在使用 NLTK。

【问题讨论】:

    标签: nlp nltk named-entity-recognition


    【解决方案1】:

    您正在描述coreference resolution 和命名实体链接的问题。我提供了单独的链接,因为我不完全确定您指的是哪一个。

    • Coreference:Stanford CoreNLP 目前拥有最好的实现之一,但它是在 Java 中实现的。我使用了python bindings,但我不太高兴——我最终只通过斯坦福管道运行了所有数据,然后在 python 中加载了处理后的 XML 文件。显然,如果您必须实时处理,这将不起作用。
    • 命名实体链接:查看Apache Stanbol 和以下Stackoverflow post 中的链接。

    【讨论】:

    • 运行...? +1,感谢您的链接——他们正在帮助研究
    猜你喜欢
    • 2014-03-17
    • 1970-01-01
    • 2021-08-18
    • 2015-03-30
    • 1970-01-01
    • 2017-11-13
    • 2015-01-11
    • 2011-07-31
    • 2018-03-08
    相关资源
    最近更新 更多