【发布时间】:2018-09-29 17:24:45
【问题描述】:
我有一个很大的(~50k)术语列表,其中一些关键短语/术语具有相应的首字母缩略词/缩写。我需要一种快速的方法来查找缩写或扩展缩写(即 MS -> Microsoft ),然后将其替换为完整的扩展缩写 + 缩写(即 Microsoft -> Microsoft (MS) 或 MS -> Microsoft (MS) ) .
我对 spaCy 很陌生,所以我的幼稚方法是使用 spacy_lookup 并使用缩写和扩展缩写作为关键字,然后使用某种 pipeline extension 然后进行匹配并将它们替换为完整的扩展缩写 + 缩写。
有没有更好的方法来标记和解析 spaCy 中的首字母缩写词/缩写词?
【问题讨论】:
标签: python-3.x nlp spacy