【问题标题】:How to use SyntaxNet parser/tagger with spaCy API?如何将 SyntaxNet 解析器/标记器与 spaCy API 一起使用?
【发布时间】:2016-10-22 09:00:03
【问题描述】:

我一直在使用spaCy Python 包来解析和标记文本,并使用生成的依赖树和其他属性来获取含义。现在我想使用 SyntaxNet 的 Parsey McParseface 进行解析和依赖标记(这似乎更好),但我想继续使用 spaCy API,因为它非常易于使用并且它做了很多 Parsey 没有做的事情。 SyntaxNet 以 CoNLL 格式输出 POS 标签和依赖标签/树:

  1. Bob _ NOUN NNP _ 2 nsubj _ _
  2. 带来了 _ VERB VBD _ 0 ROOT _ _
  3. _DET DT _ 4 det _ _
  4. pizza _ NOUN NN _ 2 dobj _ _
  5. 到 _ ADP IN _ 2 prep _ _
  6. Alice _ NOUN NNP _ 5 pobj _ _
  7. 。 _ . . _ 2 点 _ _

spaCy 似乎能够正确读取 CoNLL 格式 here。但我不知道在 spaCy 的 API 中哪里需要一个 CoNLL-fromatted 字符串。

【问题讨论】:

    标签: python nlp syntaxnet spacy


    【解决方案1】:

    来自the spaCy blog

    显然,我们希望在 Parsey McParseface 和 spaCy 之间架起一座桥梁,以便您可以使用更准确的模型和更甜美的 spaCy API。

    但是,在这成为可能之前,似乎还有很多工作要做。

    另请参阅 spaCy 作者的回复 here

    【讨论】:

      【解决方案2】:

      有没有人设法让 SyntaxNet 作为服务运行?将注释加载到 spaCy 中没有问题。问题是 SyntaxNet 主要是一个研究系统,它足以满足实验需要从磁盘对批量文本进行操作。

      如果您满足于从磁盘读取,那么应该没有问题 --- 只需读取 CoNLL 格式,然后您可以将注释应用到 spaCy Doc 对象。

      【讨论】:

      【解决方案3】:

      我没有尝试使用 spaCy,但我已经设法在 Python NLTK 的类/结构中使用 SyntaxNet 的输出,例如 DependencyGraph 和 Tree。

      这是一个完整的例子:

      http://www.davidsbatista.net/blog/2017/03/25/syntaxnet/

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2019-12-12
        • 2013-01-30
        • 1970-01-01
        • 2023-04-05
        • 1970-01-01
        • 2020-01-03
        • 2020-06-14
        • 2020-09-11
        相关资源
        最近更新 更多