【问题标题】:Anyone know of some good Word Sense Disambiguation software? [closed]谁知道一些好的词义消歧软件? [关闭]
【发布时间】:2011-06-04 13:37:30
【问题描述】:

什么代表词义消歧 (WSD) 软件的最新技术?哪些指标决定了最新技术,哪些工具包/开源包可用?

【问题讨论】:

  • 我已经试过了,只是想知道网络上的其他软件。
  • Define "good" :-) 如果工具包方法是可以接受的,那么 Python 的 NLTK 工具包值得一看。开源并且有几本好书,包括 O'Reilly 的一本,它已经在网上公开出版。用于教学,因此通常每个支持的操作都有多个实现的算法,并且这些书籍对他们来说非常实用。
  • 最先进的 WSD 一直在每个 SemEval 周期(即每 3 年)都在改变。这是因为由于新的机器学习技术和感官注释/相关资源的可用性,评估标准一直在发生变化。对于多年来开发的评估和 WSD 科学的全面概述,我会推荐 SemEval 维基百科页面或 SemEval 门户网站aclweb.org/aclwiki/index.php?title=SemEval_Portal

标签: nlp disambiguation word-sense-disambiguation


【解决方案1】:

我的清单并不详尽,但谷歌搜索肯定会更好地满足您的目的。

这里有一个简短的软件列表,记得引用相关来源!!!

GWSD:基于无监督图的词义消歧 http://lit.csci.unt.edu/~rada/downloads/GWSD/GWSD.1.0.tar.gz

SenseLearner:全词词义消歧工具 http://lit.csci.unt.edu/~rada/downloads/senselearner/SenseLearner2.0.tar.gz

KYOTO UKB 基于图形的 WSD http://ixa2.si.ehu.es/ukb/

pyWSD:简单 WSD 算法的 Python 实现 https://github.com/alvations/pywsd


WSD 任务在某种程度上也依赖于数据源,所以这里有一些,记住也要引用它们!!!

Open Mind Word Expert Sense 标记数据 http://teach-computers.org/word-expert.html

TWA Sense 标记数据 http://lit.csci.unt.edu/~rada/downloads/TWA/TWA.tar.gz

SemCor http://lit.csci.unt.edu/~rada/downloads/semcor/semcor1.6.tar.gz


最后,WSD 任务依赖于一些预处理,如果您正在研究最先进的跨语言 WSD,那么您应该尝试寻找像

这样的词级对齐器
  • 摩西
  • MGIZA++
  • 吉萨++
  • BerkeleyAligner

此外,查看之前的 Senseval/SemEval 页面,了解已经完成的工作,以及未来任务的发展趋势。 http://en.wikipedia.org/wiki/SemEval

【讨论】:

  • 嗨,我需要在 java 旁边使用基于 wordnet 的 WSD。你能推荐一个jar文件或任何执行这个功能的包吗
  • @2er0 你的项目成功了吗?
  • 跨语言 WSD 确实是一项艰巨的任务,我在 @SemEval-2013 的游戏中排名最后,但我的余弦系统非常“资源精简”,我认为如果有足够的数据,它应该可以适当地扩展到至少接近第三/第四名。
猜你喜欢
  • 1970-01-01
  • 2011-08-02
  • 2010-10-01
  • 2021-01-03
  • 2010-10-23
  • 2014-08-11
  • 2010-10-03
  • 1970-01-01
  • 2015-04-20
相关资源
最近更新 更多