【发布时间】:2019-10-30 05:20:06
【问题描述】:
我有大约 20,000 行这样的数据,
Id | value
1 30
2 3
3 22
..
n 27
我对我的数据进行了统计,平均值 33.85,中位数 30.99,最小值 2.8,最大值 206,95% 置信区间 0.21.. 所以大多数值在 33 左右,并且有一些异常值(一点点).. 所以这似乎是一个长尾分布。
我对发行版和 python 都是新手,我尝试了 class fitter https://pypi.org/project/fitter/ 来尝试 Scipy 包中的许多发行版,并且 loglaplace 发行版显示出最低的错误(虽然不是很明白)。
我阅读了该线程中的几乎所有问题,并得出了两种方法 (1) 拟合分布模型,然后在我的模拟中绘制随机值 (2) 计算不同组值的频率,但此解决方案不会例如,值大于 206。
如果我的数据是值(数字),那么在我的模拟中我需要绘制数字时,在 python 中将分布拟合到我的数据的最佳方法是什么。随机数必须与我的数据具有相同的模式。我还需要通过绘制我的数据和模型曲线来验证模型是否能够很好地呈现我的数据。
【问题讨论】:
标签: python-3.x scipy simulation distribution