【发布时间】:2016-12-19 04:03:18
【问题描述】:
我看过斯坦福 NER 和 Polyglot。两者都不支持泰米尔语。 我想使用 ML 和一些基于规则的 NLP 处理来进行实体识别
【问题讨论】:
-
嗨,我正在研究一个类似的研究领域。您介意分享您是否能够找到任何库或您想出的解决方案是什么?会有很大帮助!
标签: nlp named-entity-recognition
我看过斯坦福 NER 和 Polyglot。两者都不支持泰米尔语。 我想使用 ML 和一些基于规则的 NLP 处理来进行实体识别
【问题讨论】:
标签: nlp named-entity-recognition
Stanford NER 和 Polyglot 都不是基于规则的。如果您只考虑基于规则的系统,您可能应该寻找能够正确处理泰米尔语的现有框架,或者转向通用框架(例如GATE)。
查看this paper 报告现有泰米尔语 NER 系统,您可以联系作者。
如果您发现没有可用的系统,使用现有数据集(例如 NER-FIRE2013 和 NER-FIRE2014)训练一个系统应该相当容易:询问组织者如何获得对这些数据集的访问权限。
希望这会有所帮助!
【讨论】: