【发布时间】:2014-11-18 21:58:40
【问题描述】:
我正在使用 CRFSuite 进行序列分类(POS 标记)。令我惊讶的是,CRFSuite 似乎不喜欢这个标签':' 以 ':' 作为实际标签的单元或标记被完全跳过(预测输出中没有关于丢失或跳过的项目的备注)
我使用其他与标点符号相关的标签,例如“.”或“,”,但这些都被正确使用和输出。
有没有人有类似的经历或现在为什么跳过':'?
【问题讨论】:
我正在使用 CRFSuite 进行序列分类(POS 标记)。令我惊讶的是,CRFSuite 似乎不喜欢这个标签':' 以 ':' 作为实际标签的单元或标记被完全跳过(预测输出中没有关于丢失或跳过的项目的备注)
我使用其他与标点符号相关的标签,例如“.”或“,”,但这些都被正确使用和输出。
有没有人有类似的经历或现在为什么跳过':'?
【问题讨论】:
来自http://www.chokkan.org/software/crfsuite/tutorial.html:
CRFsuite 接受任何字符串作为属性名称,只要该字符串不包含冒号字符(用于分隔属性名称及其权重)。
所以如果你有一个像 w[0]=the:0.5 这样的属性,属性名称是“w[0]=the”,权重是 0.5。
【讨论】: