【发布时间】:2015-01-08 10:16:34
【问题描述】:
我有一个训练数据集和一个测试数据集。我们如何进行实验并获得结果? WEKA也可以用吗?
主题是使用支持向量机监督学习方法的词义消歧
这两个集合中的文档类型包括以下文件类型: 1. 2个XML文件 2. 自述文件 3. SENSEMAP 格式 4.火车格式 5.KEY格式 6.WORDS格式
【问题讨论】:
标签: nlp weka svm supervised-learning wsd
我有一个训练数据集和一个测试数据集。我们如何进行实验并获得结果? WEKA也可以用吗?
主题是使用支持向量机监督学习方法的词义消歧
这两个集合中的文档类型包括以下文件类型: 1. 2个XML文件 2. 自述文件 3. SENSEMAP 格式 4.火车格式 5.KEY格式 6.WORDS格式
【问题讨论】:
标签: nlp weka svm supervised-learning wsd
像 SVM 这样的机器学习方法在词义消歧方面并不受欢迎。
你知道Wikify吗,映射到维基百科可以认为是非常精细的词义消歧。
在这种情况下回答您的问题;任何机器学习技术都可以给你想要的结果。人们应该更担心要提取的特征,并确保单词特征足够独特,可以在您选择的级别上解决歧义。例如在句子中:Wish you a very Happy Christamas 你只想将Happy Christmas 区分为书籍或节日。
【讨论】: