【问题标题】:opennlp chunker and postag resultsopennlp chunker 和 postag 结果
【发布时间】:2017-12-15 03:55:51
【问题描述】:

Java - opennlp

我是 opennlp 的新手,我正在尝试分析句子并获得 post 标签和块结果,但我无法理解值的含义。有没有表可以解释post标签和chunk结果值的完整形式含义?

Tokens: [My, name, is, Chris, corrale, and, I, live, in, Philadelphia, USA, .]
Post Tags: [PRP$, NN, VBZ, NNP, NN, CC, PRP, VBP, IN, NNP, NNP, .]
chunk Result: [B-NP, I-NP, B-VP, B-NP, I-NP, O, B-NP, B-VP, B-PP, B-NP, I-NP, O]

【问题讨论】:

    标签: opennlp


    【解决方案1】:

    POS 标签来自Penn Treebank tagset。组块是名词短语 (NP)、动词短语 (VP) 和介词 (PP)。 “B-..”标志着这样一个短语的开始,“I-..”表示类似于“内在”的意思,即短语在此处继续(参见OpenNLP docs)。

    【讨论】:

      【解决方案2】:

      S -> 简单的声明性子句,即不是由 a 引入的子句 (可能为空)从属 连词或 wh 词且不显示主谓 倒置。

      SBAR -> 由(可能为空的)从属连词引入的子句。

      SBARQ -> 由 wh 词或 wh 短语引入的直接问题。 间接问题和关系从句应括在括号中 SBAR,不是 SBARQ。

      SINV -> 倒置陈述句,即主语 跟在时态动词或情态之后。

      SQ -> 倒置的是/否问题,或 wh 问题的主要子句,如下 SBARQ 中的 wh 短语。

      ADJP -> 形容词短语。

      ADVP -> 副词短语。

      CONJP -> 连词。

      FRAG -> 片段。

      INTJ -> 感叹词。大致对应于词性标签 呃。

      LST -> 列表标记。包括周围的标点符号。

      NAC -> 不是成分;用于表示某些名词前的范围 NP 中的修饰语。

      NP -> 名词短语。

      NX -> 在某些复杂的 NP 中用于标记 NP 的头部。 非常粗略地对应于 N-bar

      PP -> 介词短语。

      PRN -> 括号内。

      PRT -> 粒子。应标记为 RP 的单词的类别。

      QP -> 量词短语(即复杂的度量/数量短语);内使用 NP。

      RRC -> 简化的关系从句。

      UCP -> 与并列短语不同。

      VP -> 动词短语。

      WHADJP -> Wh 形容词短语。包含 wh 副词的形容词短语,如 有多热。

      WHAVP -> Wh 副词短语。引入一个带有 NP 间隔的子句。可能为空 (包含 0 补码) 或词汇,包含一个 wh 副词,例如如何或为什么。

      WHNP -> Wh 名词短语。引入一个带有 NP 间隔的子句。可能为空 (包含 0 补码) 或词汇,包含一些 wh 词,例如谁,哪本书,谁的 女儿,一个都没有,或者如何 许多豹子。

      WHPP -> Wh 介词短语。包含 wh 名词的介词短语 短语 (例如由谁或由谁授权) PP 间隙或被 WHNP 包含。

      X -> 未知、不确定或不可括号。 X 常用于包围 拼写错误和括号 那个……那个结构。

      信用:http://mail-archives.apache.org/mod_mbox/opennlp-users/201402.mbox/%3CCACQuOSXOeyw2O-AZtW3m=iABo1=3cpZOdPiWFXoNwN-SVWo4gQ@mail.gmail.com%3E

      【讨论】:

        【解决方案3】:

        请参考POSTag list 获取标签详情。

        像“B-NP”这样的块标签由两个或三个部分组成:
        第一部分

        B - marks the beginning of a chunk
        I - marks the continuation of a chunk
        E - marks the end of a chunk
        

        作为一个chunk,它可能只有一个词长(如上例中的“She”),它可以同时是一个chunk的开头和结尾。

        第二部分

        NP - noun chunk
        VP - verb chunk
        

        更多参考可以参考OpenNLP Documentation

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2015-06-01
          • 2020-12-14
          • 2014-01-16
          • 2014-09-17
          • 1970-01-01
          相关资源
          最近更新 更多