【问题标题】:Chi Squared Analysis on Data sets that don't have matching frequencies没有匹配频率的数据集的卡方分析
【发布时间】:2022-08-02 18:18:21
【问题描述】:

我有 15 个数据集,每个数据集都拟合了一条曲线。现在我正在尝试通过卡方检验来确定拟合质量;但是,当我运行我的代码时:

chi, p_value = stats.chisquare(n, y)

其中n 是实际数据,y 是预测数据,我得到了错误

对于每个轴切片,观察到的频率之和必须与预期频率之和一致,相对容差为 1e-08,但百分比差异为: 0.1350785306607008

我似乎无法理解为什么它们必须加起来相同的总数 - 有什么方法可以在不混淆数据的情况下运行卡方检验?

    标签: python statistics


    【解决方案1】:

    这种拟合优度的卡方检验确实要求两个输入的总和(几乎)相同。因此,如果您想检查您的模型是否适合观察n,您必须调整模型的计数y,如所述,例如here。这可以用一个小包装器来完成:

    from scipy.stats import chisquare
    import numpy as np
    
    def cs(n, y):
        return chisquare(n, np.sum(n)/np.sum(y) * y)
    

    另一种可能性是选择 R 并使用 chisq.test

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-03-03
      • 1970-01-01
      • 1970-01-01
      • 2019-09-05
      • 1970-01-01
      • 1970-01-01
      • 2012-10-09
      • 1970-01-01
      相关资源
      最近更新 更多