【发布时间】:2021-03-31 17:01:34
【问题描述】:
我想知道spacy 是否有一些API 可以像使用word2phrase 或gensim 中的Phrases 类时那样进行短语* 提取。谢谢。
PS。短语在语言学中也称为搭配。
【问题讨论】:
我想知道spacy 是否有一些API 可以像使用word2phrase 或gensim 中的Phrases 类时那样进行短语* 提取。谢谢。
PS。短语在语言学中也称为搭配。
【问题讨论】:
我想知道您是否看到过 SpaCy 的 PyTextRank 或 spacycaKE 扩展?
两者都可以帮助使用 SpaCy 提取 not possible directly 的短语。
【讨论】:
spaCy 的 noun chunks 功能是一种有用的短语提取形式,尽管与 gensim 的 Phrases 或 word2phrase 完全不同。
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp("Autonomous cars shift insurance liability toward manufacturers")
for chunk in doc.noun_chunks:
print(chunk.text, chunk.root.text, chunk.root.dep_,
chunk.root.head.text)
输出:
Autonomous cars cars nsubj shift
insurance liability liability dobj shift
manufacturers manufacturers pobj toward
您还可以使用rule-based matchers 获取由词性序列、依赖关系或其他规范定义的其他类型的短语。
【讨论】: