【问题标题】:Conjuncts are not identified completely in spaCy?在 spaCy 中没有完全识别连词?
【发布时间】:2021-05-14 11:16:13
【问题描述】:

我想通过在 spaCy 依赖解析中使用 .conjuncts 来识别所有的连接。

但是,我发现了一个问题:不是所有的连词都被识别出来了。

例如,在下面的句子模板中:

A....B....C.... D....

如果ADconj依赖关系; CD 也有 conj 关系。但是,ABC 没有conj 关系; DBC 没有 conj 关系。

在这种情况下,CD 之间的conj 关系可以通过使用.displacyBUT 显示在图形依赖关系中,同时使用.conjuncts 来列出所有连词对(块和连词),C 的连词(元组)为空()D 的连词(元组)为空()

获取连词的代码:

prev_end=0
for chunk in doc.noun_chunks:
    span = doc[prev_end: chunk.end]
    conj_ = span.conjuncts
    prev_end = chunk.end 

--有人知道原因吗?

--是因为 spaCy 库中的 bug 还是其他原因?

提前致谢!

【问题讨论】:

    标签: python parsing dependencies spacy


    【解决方案1】:

    the forum 对此进行了详细回答,但这里的问题是您没有使用名词块,而是使用了包含名词块的句子的划分。

    当您在跨度上调用.conjuncts 时,您将获得跨度根的合取。在名词块中,头部名词是词根,但有时跨度包括动词,因此连词可能是该动词的连词,而不是名词块的头部。

    【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多