【发布时间】:2014-05-23 23:06:06
【问题描述】:
我尝试使用斯坦福 NER 来解析产品数据。我的训练数据如下所示:
iPhone 4 16GB black
Nikon D5100
Apple iPhone 4s
kindle touch
kindle fire
现在我想用这些数据训练 NER,所以我必须先对其进行分类。斯坦福网站提供了一个示例,他们解析一本书的一章并标记新行中的每个单词。这对我来说没有帮助,因为数据看起来像:
iPhone
4
16GB
black
“4”不应该换行,但是当我把“iPhone 4”换行时,NER认为“4”是token“iPhone”的类别。
我只需要一些帮助来使用产品数据训练 NER。你有什么建议?您会将“iPhone”归类为“电话”,将“iPhone 4”归类为“电话”吗?
【问题讨论】:
标签: stanford-nlp named-entity-recognition