【发布时间】:2017-11-14 15:58:58
【问题描述】:
我正在使用斯坦福分类器提供的最大熵算法来执行自定义的命名实体识别。 输出文件提供 5 列 --> word \t ground-truth \t label \t P(clAnswer) \t P(goldAnswer))
P(clAnswer) 和 P(goldAnswer) 有什么区别,它们是如何计算的?
【问题讨论】:
标签: stanford-nlp maxent
我正在使用斯坦福分类器提供的最大熵算法来执行自定义的命名实体识别。 输出文件提供 5 列 --> word \t ground-truth \t label \t P(clAnswer) \t P(goldAnswer))
P(clAnswer) 和 P(goldAnswer) 有什么区别,它们是如何计算的?
【问题讨论】:
标签: stanford-nlp maxent
P(clAnswer) 是模型给出猜测的概率。 P(goldAnswer) 是模型给出真正黄金答案的概率。
如果你想了解分类器背后的算法,你可以在这个链接找到资源:https://nlp.stanford.edu/software/classifier.shtml
我应该注意到,使用 CRFClassifier 训练 NER 模型是标准的。这里有关于训练 NER 模型的详尽文档:
【讨论】: