如果我没有理解错,您希望找到拟合分布的模式,而不是给定数据的模式。基本上,我们可以通过以下 3 个步骤来完成。
第 1 步:从分布生成数据集
from scipy import stats
from scipy.optimize import minimize
# generate a norm data with 0 mean and 1 variance
data = stats.norm.rvs(loc= 0,scale = 1,size = 100)
data[0:5]
输出:
数组([1.76405235, 0.40015721, 0.97873798, 2.2408932, 1.86755799])
第二步:拟合参数
# fit the parameters of norm distribution
params = stats.norm.fit(data)
params
输出:
(0.059808015534485, 1.0078822447165796)
注意stats.norm有两个参数,即loc和scale。对于scipy.stats中的不同dist,参数不同。我认为将参数存储在一个元组中然后在下一步解包它很方便。
第三步:获取拟合分布的众数(密度函数的最大值)
# continuous case
def your_density(x):
return -stats.norm.pdf(x,*paras)
minimize(your_density,0).x
输出:
0.05980794
请注意,norm 分布的 mode 等于 mean。在这个例子中这是一个巧合。
还有一件事是scipy 对待连续分布和离散分布不同(它们有不同的父类),您可以在离散分布上使用以下代码来做同样的事情。
## discrete dist, example for poisson
x = np.arange(0,100) # the range of x should be specificied
x[stats.poisson.pmf(x,mu = 2).argmax()] # find the x value to maximize pmf
输出:
1
您可以尝试使用自己的数据和分布!