使用 WEKA 进行词义消歧答案

【问题标题】：Word sense disambiguation using WEKA使用 WEKA 进行词义消歧
【发布时间】：2015-01-08 10:16:34
【问题描述】：

我有一个训练数据集和一个测试数据集。我们如何进行实验并获得结果？ WEKA也可以用吗？

主题是使用支持向量机监督学习方法的词义消歧

这两个集合中的文档类型包括以下文件类型： 1. 2个XML文件 2. 自述文件 3. SENSEMAP 格式 4.火车格式 5.KEY格式 6.WORDS格式

【问题讨论】：

标签： nlp weka svm supervised-learning wsd

【解决方案1】：

像 SVM 这样的机器学习方法在词义消歧方面并不受欢迎。
你知道Wikify吗，映射到维基百科可以认为是非常精细的词义消歧。
在这种情况下回答您的问题；任何机器学习技术都可以给你想要的结果。人们应该更担心要提取的特征，并确保单词特征足够独特，可以在您选择的级别上解决歧义。例如在句子中：Wish you a very Happy Christamas 你只想将Happy Christmas 区分为书籍或节日。

【讨论】：

从我参考过的各种论文中发现，SVM 是词义消歧的最佳方法之一。
我想知道如果我有使用 WEKA 或 R 的训练集，是否可以评估测试集？
评估测试集是什么意思？你的测试集是什么（任何链接？）反正我以前从未使用过 WEKA。
好吧，如果不是 WEKA，R？我将 Senseval-3 EnglishLS 用作训练和测试数据集