【发布时间】:2022-11-12 11:27:03
【问题描述】:
我有一些大的 .csv 实验数据文件。它们的大小在 30MB-3GB 范围内。我已经使用 pandas 成功阅读了它们,并对数据进行了一些其他计算。就目前而言,我有一个非常长的一维数组,我需要取其平均值。
默认情况下,我使用了 statistics.mean(array) 但这似乎需要很长时间才能运行。
通过测试我的代码的各个部分,我确定这是行 statistics.mean(array) 需要很长时间才能运行。
有没有比这更有效的方法来计算大型数据集的平均值?
谢谢!
def GetMean(ionVelocityArray):
return stats.mean(ionVelocityArray)
我已经等待了 2 个小时,让这个函数在 30MB 文件上完成运行。
【问题讨论】:
标签: python statistics mean