【问题标题】:How is feature is different from tag in Stanford-NER?特征与 Stanford-NER 中的标签有何不同?
【发布时间】:2016-10-05 16:21:12
【问题描述】:

http://nlp.stanford.edu/software/CRF-NER.shtml 的常见问题解答告诉我们可以在训练时包含我们的自定义功能。 首先,NER 中有哪些功能?它与 tsv 训练文件中的标签有何不同? 正如这个问题Stanford-NER customization to classify software programming keywords所问的那样,在tsv的特征列中表示标签'Programming_Language','Operating_System'是否正确?

有点混乱,请解释一下。

【问题讨论】:

    标签: stanford-nlp


    【解决方案1】:

    标签是您要应用于令牌的标签。例如 O、PERSON、LOCATION、ORGANIZATION、PROGRAMMING_LANGUAGE。 O 表示不是实体。

    特征是您希望 CRF 分类器在其决策中使用的令牌流的一个方面。

    考虑一下“我去年夏天去了法国”这句话。

    标签将是 [O O O LOCATION O O O]。

    例如,特征可能是单词本身,“word=France”。

    特征可能是序列“word_n-2_n-1=went to”中当前单词之前的最后两个单词。

    或者一个特征可能是“shape=Xxxxxx”这个词的形状

    这些特征的重点是 CRF 分类器可以找到模式,例如具有特定形状的单词往往是 O,或者特定的单词往往属于特定的类。

    如果您只想添加新类别(例如 PROGRAMMING_LANGUAGE 或 OPERATING_SYSTEM),则不需要自定义功能。您只需要训练数据,这样系统就可以学习如何适当地标记标记。

    【讨论】:

    • 谢谢.. 得到了我需要的东西。
    猜你喜欢
    • 2017-11-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-11-21
    • 2011-02-06
    • 1970-01-01
    相关资源
    最近更新 更多