【问题标题】:Phrase extraction with Spacy用 Spacy 提取短语
【发布时间】:2021-03-31 17:01:34
【问题描述】:

我想知道spacy 是否有一些API 可以像使用word2phrasegensim 中的Phrases 类时那样进行短语* 提取。谢谢。

PS。短语在语言学中也称为搭配。

【问题讨论】:

    标签: nlp spacy gensim phrase


    【解决方案1】:

    我想知道您是否看到过 SpaCy 的 PyTextRankspacycaKE 扩展?

    两者都可以帮助使用 SpaCy 提取 not possible directly 的短语。

    【讨论】:

      【解决方案2】:

      spaCy 的 noun chunks 功能是一种有用的短语提取形式,尽管与 gensim 的 Phrases 或 word2phrase 完全不同。

      import spacy
      
      nlp = spacy.load("en_core_web_sm")
      doc = nlp("Autonomous cars shift insurance liability toward manufacturers")
      for chunk in doc.noun_chunks:
          print(chunk.text, chunk.root.text, chunk.root.dep_,
                  chunk.root.head.text)
      

      输出:

      Autonomous cars cars nsubj shift
      insurance liability liability dobj shift
      manufacturers manufacturers pobj toward
      

      您还可以使用rule-based matchers 获取由词性序列、依赖关系或其他规范定义的其他类型的短语。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2017-11-23
        • 2021-09-18
        • 2022-12-11
        • 1970-01-01
        • 2020-10-27
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多