【发布时间】:2016-10-22 09:00:03
【问题描述】:
我一直在使用spaCy Python 包来解析和标记文本,并使用生成的依赖树和其他属性来获取含义。现在我想使用 SyntaxNet 的 Parsey McParseface 进行解析和依赖标记(这似乎更好),但我想继续使用 spaCy API,因为它非常易于使用并且它做了很多 Parsey 没有做的事情。 SyntaxNet 以 CoNLL 格式输出 POS 标签和依赖标签/树:
- Bob _ NOUN NNP _ 2 nsubj _ _
- 带来了 _ VERB VBD _ 0 ROOT _ _
- _DET DT _ 4 det _ _
- pizza _ NOUN NN _ 2 dobj _ _
- 到 _ ADP IN _ 2 prep _ _
- Alice _ NOUN NNP _ 5 pobj _ _
- 。 _ . . _ 2 点 _ _
spaCy 似乎能够正确读取 CoNLL 格式 here。但我不知道在 spaCy 的 API 中哪里需要一个 CoNLL-fromatted 字符串。
【问题讨论】:
标签: python nlp syntaxnet spacy