【发布时间】:2021-05-14 11:16:13
【问题描述】:
我想通过在 spaCy 依赖解析中使用 .conjuncts 来识别所有的连接。
但是,我发现了一个问题:不是所有的连词都被识别出来了。
例如,在下面的句子模板中:
A....B....C.... D....
如果A和D有conj依赖关系; C 和 D 也有 conj 关系。但是,A 与B 和C 没有conj 关系; D 与 B 和 C 没有 conj 关系。
在这种情况下,C 和D 之间的conj 关系可以通过使用.displacy,BUT 显示在图形依赖关系中,同时使用.conjuncts 来列出所有连词对(块和连词),C 的连词(元组)为空(),D 的连词(元组)为空()。
获取连词的代码:
prev_end=0
for chunk in doc.noun_chunks:
span = doc[prev_end: chunk.end]
conj_ = span.conjuncts
prev_end = chunk.end
--有人知道原因吗?
--是因为 spaCy 库中的 bug 还是其他原因?
提前致谢!
【问题讨论】:
标签: python parsing dependencies spacy