【发布时间】:2021-06-04 03:12:27
【问题描述】:
假设我有一系列每小时测量值,例如平均风速。开始和结束日期用于在时间方面限制数据。 根据这些数据,我可以计算各个类别的值的频率。第一类包括 0 到
Category Amount Frequency (in %)
0-1 km/h 42 0.64
1-2 km/h 444 6.78
2-3 km/h 871 13.30
3-4 km/h 1130 17.25
4-5 km/h 1119 17.08
5-6 km/h 934 14.26
6-7 km/h 703 10.73
7-8 km/h 490 7.48
8-9 km/h 351 5.36
9-10 km/ 219 3.34
10-11km/h 143 2.18
11-12 km/h 52 0.79
12-13 km/h 13 0.20
13-14 km/h 15 0.23
14-15 km/h 6 0.09
15-16 km/h 6 0.09
16-17 km/h 4 0.06
17-18 km/h 3 0.05
18-19 km/h 4 0.06
20-21 km/h 2 0.03
如何根据这些值确定 Weibull 比例因子和 Weibull 形状因子(例如,使用 python,可靠性 (?))?
到目前为止,我只将测量系列中的所有单个值传递给 python 可靠性 (Fit_Weibull_2P),从而确定了这两个参数。但是,确定的参数似乎不正确(曲线稍后绘制不正确)或者我没有将值正确传递给 Fit_Weibull_2P。
有没有人知道我在哪里出错或如何以不同的方式解决它?也许不是个人价值观,而是频率?
【问题讨论】:
-
好吧,如果您只有分箱值,那么正确的处理方法是所谓的区间删失加上加权最大似然。紧随其后的是仅将加权最大似然应用于箱的中点(即,忽略宽度),第三种方法是通过发明代表箱中点的复制数据来近似第二种方法,复制次数成比例到 bin 频率。例如。 0.5 km/h 64 个副本,1.5 678 个副本,2.5 个 1330 个副本,等等。然后对其应用普通 Weibull 拟合。
-
但首先看看您使用的任何库是否已经处理分箱或审查数据。
-
谢谢,我已经测试了
scipy(exponweib.fit) 和reliability(Fit_Weibull_2P)。无论是所有样本数据,我都得到了似乎被低估的形状和比例的两个函数值(形状:2.01,比例:3.68)。所以我试图找到一个通过直方图的 bin 来估计参数的解决方案。在分箱值上使用exponweib.fit_loc_scale(data, 1, 1)我得到其他结果:形状:0.92,比例:6.32。正如我对测试数据的引用的另一个 Web 应用程序所建议的那样,我预计形状的值约为 1.98,比例的值约为 5.60。 R 的结果似乎很合适。 -
可能很明显,如果你想适应例如来自风电场的估计功率,做重要性加权:最小积分(powercurve *(数据 - Weibull))可能与最小积分(数据 - Weibull)完全不同。
标签: python statistics data-science reliability weibull