【发布时间】:2014-06-24 18:54:22
【问题描述】:
我一直在尝试使用CMU's TurboParser 生成的依赖解析树。它完美无缺。然而,问题是文档很少。我需要准确理解他们解析器的输出。例如,句子“我用统计数据解决了问题。”生成以下输出:
1 I _ PRP PRP _ 2 SUB
2 solved _ VBD VBD _ 0 ROOT
3 the _ DT DT _ 4 NMOD
4 problem _ NN NN _ 2 OBJ
5 with _ IN IN _ 2 VMOD
6 statistics _ NNS NNS _ 5 PMOD
7 . _ . . _ 2 P
我没有找到任何可以帮助理解各个列代表什么以及倒数第二列 (2, 0, 4, 2, ... ) 中的索引是如何创建的文档。另外,我不知道为什么有两列专门用于词性标签。任何帮助(或指向外部文档的链接)都会有很大帮助。
附:如果你想试试他们的解析器,here is their online demo。
附言请不要建议使用斯坦福的依赖解析输出。我对线性规划算法很感兴趣,这不是斯坦福的 NLP 系统所做的。
【问题讨论】:
标签: nlp parse-tree