【问题标题】:Word sense disambiguation using WEKA使用 WEKA 进行词义消歧
【发布时间】:2015-01-08 10:16:34
【问题描述】:

我有一个训练数据集和一个测试数据集。我们如何进行实验并获得结果? WEKA也可以用吗?

主题是使用支持向量机监督学习方法的词义消歧

这两个集合中的文档类型包括以下文件类型: 1. 2个XML文件 2. 自述文件 3. SENSEMAP 格式 4.火车格式 5.KEY格式 6.WORDS格式

【问题讨论】:

    标签: nlp weka svm supervised-learning wsd


    【解决方案1】:

    像 SVM 这样的机器学习方法在词义消歧方面并不受欢迎。
    你知道Wikify吗,映射到维基百科可以认为是非常精细的词义消歧。
    在这种情况下回答您的问题;任何机器学习技术都可以给你想要的结果。人们应该更担心要提取的特征,并确保单词特征足够独特,可以在您选择的级别上解决歧义。例如在句子中:Wish you a very Happy Christamas 你只想将Happy Christmas 区分为书籍或节日。

    【讨论】:

    • 从我参考过的各种论文中发现,SVM 是词义消歧的最佳方法之一。
    • 我想知道如果我有使用 WEKA 或 R 的训练集,是否可以评估测试集?
    • 评估测试集是什么意思?你的测试集是什么(任何链接?)反正我以前从未使用过 WEKA。
    • 好吧,如果不是 WEKA,R?我将 Senseval-3 EnglishLS 用作训练和测试数据集
    猜你喜欢
    • 2011-10-13
    • 2017-04-16
    • 2014-08-11
    • 2015-04-20
    • 2017-09-25
    • 2014-10-31
    • 2011-04-11
    • 2013-04-03
    • 2015-02-09
    相关资源
    最近更新 更多