【发布时间】:2023-04-07 19:06:01
【问题描述】:
我想从语料库中提取相似的词。相似度基于字符串。即,当两个词的串高度相似时,将两个词提取为相似词。例如,如果语料库包含:Aras、bahro、arasis、adkpo、bah、aras sd、kio。
相似词:
1- aras,arasis,aras sd
2- 呸,呸
如何解决这个问题? 谢谢。
【问题讨论】:
标签: nlp string-matching similarity text-extraction approximate