【问题标题】:Can anyone give a brief overview of how to proceed with Named Entity Recognition in Tamil Language?谁能简要概述如何在泰米尔语中进行命名实体识别?
【发布时间】:2016-12-19 04:03:18
【问题描述】:

我看过斯坦福 NER 和 Polyglot。两者都不支持泰米尔语。 我想使用 ML 和一些基于规则的 NLP 处理来进行实体识别

【问题讨论】:

  • 嗨,我正在研究一个类似的研究领域。您介意分享您是否能够找到任何库或您想出的解决方案是什么?会有很大帮助!

标签: nlp named-entity-recognition


【解决方案1】:

Stanford NER 和 Polyglot 都不是基于规则的。如果您只考虑基于规则的系统,您可能应该寻找能够正确处理泰米尔语的现有框架,或者转向通用框架(例如GATE)。

查看this paper 报告现有泰米尔语 NER 系统,您可以联系作者。

如果您发现没有可用的系统,使用现有数据集(例如 NER-FIRE2013NER-FIRE2014)训练一个系统应该相当容易:询问组织者如何获得对这些数据集的访问权限。

希望这会有所帮助!

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-10-31
    • 2013-08-06
    • 1970-01-01
    • 2011-08-11
    • 1970-01-01
    • 2019-03-30
    相关资源
    最近更新 更多