【发布时间】:2016-09-19 19:33:45
【问题描述】:
伙计们,有没有人想过构建 NER 模型来标记文本序列(如地址或时间表达)?
有一个用于诸如“过去五天”之类的时间表达式的解析器,称为 SUTime:http://nlp.stanford.edu/software/sutime.shtml。不幸的是,它是错误的,并且是由大量规则组成的。
解析地址更加困难且容易出错。 CoreNLP 解析器甚至无法解析像加利福尼亚州山景城这样简单的事物。
我觉得应该有一种方法可以训练 RNN 识别这些模式,而无需维护庞大的规则列表或庞大的查找表。
【问题讨论】:
-
有很多不同语言的深度学习库。你检查了吗?
标签: nlp named-entity-recognition recurrent-neural-network