【问题标题】:Confusion Matrix of Bayesian Network贝叶斯网络的混淆矩阵
【发布时间】:2011-02-25 18:58:10
【问题描述】:

我正在尝试了解贝叶斯网络。我有一个有10个属性的数据文件,我想获取这个数据表的混淆表,我想我需要计算所有字段的tp,fp,fn,tn。是真的吗?如果是这样,那么我需要为贝叶斯网络做些什么。

真的需要一些指导,我迷路了。

【问题讨论】:

  • 我无法理解这个问题。你的贝叶斯网络正在执行什么任务?是分类吗?如果是这样,正在分类什么,它是您数据文件中的属性之一吗?更多信息将使这个问题更容易回答。

标签: matrix probability data-mining bayesian-networks


【解决方案1】:

您要问的是一个具有两个以上类的混淆矩阵。 以下是您的操作步骤:

  • 为每个类构建一个分类器,其中训练集由 类中的文档集(正标签)及其 补充(否定标签)。
  • 给定测试文档,分别应用每个分类器。
  • 将文档分配给得分最高的班级,即 最大置信度值,或最大概率

这里是论文的参考资料,您可以了解更多信息:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.

【讨论】:

    【解决方案2】:

    这个过程通常是这样的:

    • 您有一些带标签的数据实例 你想用它来训练一个 分类器,以便它可以预测 新的未标记实例的类别。
    • 使用分类器 选择(神经网络,贝叶斯 net、SVM 等...)我们构建了一个 使用您的训练数据建模 作为输入。
    • 此时,您通常希望 评估的性能 部署之前的模型。所以使用一个 先前未使用的数据子集 (测试集),我们比较模型 这些实例的分类 与实际班级相反。一种 总结这些结果的好方法 是由一个混淆矩阵显示 每类实例如何 预测。

    对于二元分类任务,惯例是将一个类指定为正类,将另一个类指定为负类。因此,从混淆矩阵中,被正确分类为正例的正例的百分比被称为真正例(TP)率。其他定义遵循相同的约定...

    【讨论】:

      【解决方案3】:

      Confusion matrix 用于评估分类器的性能,任何分类器

      【讨论】:

        猜你喜欢
        • 2017-02-09
        • 2020-06-23
        • 2018-04-25
        • 2013-04-08
        • 1970-01-01
        • 2011-01-09
        • 2012-07-14
        • 2013-05-11
        相关资源
        最近更新 更多