【发布时间】:2019-09-06 06:30:57
【问题描述】:
使用 spark I 聚合每个组(队列)的数据以仅包含平均值、标准差和方差。
现在,在使用 python 的第二步中,我想测试正态性 (https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.normaltest.html),然后使用 t 检验 stats.ttest_ind 或 stats.wilcoxon 秩检验来检验显着性。
但是,所有这些方法都希望将数据作为原始的面向记录的值输入。如何将它们与预先聚合的数据一起使用?
【问题讨论】:
-
您需要预先汇总的数据。仅平均值和标准差就没有告诉您原始数据是否来自正态分布。
标签: python scipy statistics aggregate statistical-test