【发布时间】:2017-06-26 15:49:41
【问题描述】:
Standford NLP 生成的 PoS 标签集(包括标点符号的 PoS)及其描述是什么?
我知道这个问题已经被问过好几次了,比如:
- Java Stanford NLP: Part of Speech labels?
- http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html
- http://www.mathcs.emory.edu/~choi/doc/clear-dependency-2012.pdf
但这些答案列出了一些典型的 PoS 标签,这些标签不是特定于 Standfor NLP。例如,这些答案都没有列出斯坦福 NKLP 用于 ( 标点符号的 -LRB- PoS 标签。
我在哪里可以找到斯坦福 NLP 源代码中的 PoS 标签列表?
另外,有哪些使用SYM PoS 标签注释的令牌示例?
另外,如何知道标记是否是标点符号?
Here 他们定义了isPunctation == true if its PoS is :|,|.|“|”|-LRB-|-RRB-|HYPH|NFP|SYM|PUNC。然而,斯坦福 NLP 并不具备所有这些 PoS。
【问题讨论】:
标签: stanford-nlp