【问题标题】:Strange results for NaiveBayes under Weka's GUIWeka GUI 下朴素贝叶斯的奇怪结果
【发布时间】:2012-03-24 10:04:15
【问题描述】:

我正在使用 Weka 的 GUI 对文本文档进行分类。我的数据集是 .arff 格式。

我应用了 StringToWordVector 过滤器。然后,我应用 RemovePercentage 过滤器将我的数据集划分为训练集和测试集。它总共包含 99 个实例和 934 个属性。训练-测试拆分后,训练集包含 66 个实例,测试集包含 33 个实例。

我在训练集中学习模型:结果是 100% 作为准确率 然后,我测试了在测试集上学习到的模型:结果是 3.0303 %。

谁能帮我理解为什么我会得到 3.0303 % 以及如何改进这个结果?

【问题讨论】:

    标签: user-interface weka document-classification


    【解决方案1】:

    朴素贝叶斯学习的模型是overfitted。您可以尝试不同的训练/测试拆分(或cross validation)来防止这种情况。您也可以尝试调整朴素贝叶斯算法的参数或使用其他算法。

    【讨论】:

    • 你能告诉我如何使用 Weka 的 GUI 做到这一点吗?
    • 我想通过使用 Weka 的 GUI 来遵循此视频中提供的解决方案:link。谁能帮帮我?
    • 测试/训练分割或交叉验证的选择在预测窗口左栏的上半部分,您可以通过点击它来调整算法的参数。
    • 我想调整 NaiveBayes 分类器的参数 k,但是当我点击 NaiveBayes 算法时,我没有看到任何参数 k。
    • 我想通过调整参数k来找到朴素贝叶斯拉普拉斯平滑的解决方案。我的问题是如何在 Weka 的 GUI 中调整参数 k。
    猜你喜欢
    • 2018-02-12
    • 2015-06-01
    • 2011-04-08
    • 2012-04-09
    • 2019-11-26
    • 2011-02-23
    • 2014-11-11
    • 2016-02-05
    • 2012-04-05
    相关资源
    最近更新 更多