【发布时间】:2015-08-17 22:23:55
【问题描述】:
我正在寻找实体识别和消歧 API 或库。我发现了 JIGSAW 算法,它执行 WSD,但在单个单词级别,因此它不能将“金融机构”或“利率”识别为一个单位,即使这些单位可以在 wordnet 中找到并具有同义词集(例如,参见“金融机构”在 wordnet 中)。
但是,我找到了 BabelNet,它有一个图形网络界面,可以做到这一点。但是,它在其当前的 API v.3 中并未提供该功能
您是否知道提供此类功能的 API 或库? 我的意思是将“金融机构”或“利率”视为一个单位,并在此基础上进行语义消歧!?
提前致谢。
【问题讨论】:
-
您是否尝试过先在文本上运行斯坦福的 NER?大多数算法应该能够处理
financial_institution作为输入而不是financial institution(下划线)
标签: java wordnet named-entity-recognition word-sense-disambiguation wsd