【发布时间】:2017-07-31 01:54:24
【问题描述】:
我有一个 conll2002 格式的带注释的语料库,即一个制表符分隔的文件,带有一个标记、pos-tag 和 IOB 标记,后跟实体标记。示例:
约翰·NNP B-PERSON
我想在 NLTK 中训练 葡萄牙语 NER 模型,最好是 MaxEnt 模型。我确实不想在 NLTK 中使用“内置”斯坦福 NER,因为我已经能够使用独立的斯坦福 NER。我想使用 MaxEnt 模型与斯坦福 NER 进行比较。
我找到了NLTK-trainer,但我无法使用它。
我怎样才能做到这一点?
【问题讨论】:
标签: python nlp nltk named-entity-recognition