【问题标题】:normality test with pre-aggregated data使用预先汇总的数据进行正态性检验
【发布时间】:2019-09-06 06:30:57
【问题描述】:

使用 spark I 聚合每个组(队列)的数据以仅包含平均值、标准差和方差。

现在,在使用 python 的第二步中,我想测试正态性 (https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.normaltest.html),然后使用 t 检验 stats.ttest_indstats.wilcoxon 秩检验来检验显着性。

但是,所有这些方法都希望将数据作为原始的面向记录的值输入。如何将它们与预先聚合的数据一起使用?

【问题讨论】:

  • 您需要预先汇总的数据。仅平均值和标准差就没有告诉您原始数据是否来自正态分布。

标签: python scipy statistics aggregate statistical-test


【解决方案1】:

均值、标准差和方差不足以检验每个队列的正态性。标准差是方差的平方根,所以你只有两个统计量的信息。

您还可以(或替代地)计算两个汇总统计偏度和峰度,并保存观察计数。 Jarque–Bera test 是正态性检验,仅取决于偏度、峰度和观察次数。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-06-01
    • 2014-07-02
    • 2021-07-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-05-31
    相关资源
    最近更新 更多