【问题标题】:Interpreting the y values of a pdf解释 pdf 的 y 值
【发布时间】:2021-03-31 13:24:48
【问题描述】:

为了理解正态分布图的 y 值,我使用以下代码:

%reset -f

import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt

data = [10,10,20,40,50,60,70,80,90,100]

# Fit a normal distribution to the data:
mu, std = norm.fit(data)

# Plot the histogram.
plt.hist(data, bins=10, density=True, alpha=0.6, color='g')

# Plot the PDF.
xmin, xmax = plt.xlim()
x = np.linspace(xmin, xmax, 100)
p = norm.pdf(x, mu, std)
plt.plot(x, p, 'k', linewidth=2)
title = "Fit results: mu = %.2f,  std = %.2f" % (mu, std)
plt.title(title)

plt.show()

生成此图:

数据是一组人的年龄:[10,10,20,40,50,60,70,80,90,100]

如何解释生成的 pdf 图的 y 值?例如,play 大约等于 0.027 的条应该如何解释?

我已经阅读了各种帖子,例如:

https://stats.stackexchange.com/questions/332984/interpreting-a-pdf-plot

但找不到详细解释绘图 y 轴值的信息。

0.027是年龄在0到20左右的概率吗?

【问题讨论】:

    标签: python probability normal-distribution probability-density


    【解决方案1】:

    两个年龄 x_0 和 x_1 之间的 pdf 曲线下面积表示从 X 采样的点属于区间 [x_0, x_1] 的概率 P(x_0

    对于直方图,每个条形图代表一个区间,条形图的高度等于属于该区间的样本数,归一化以使直方图的 bin 的总面积等于 1。与 pdf 类似曲线,bin 的面积给出了随机样本属于 bin 定义的区间的概率的估计。

    如果正态分布确实是对随机变量进行建模的不错选择,那么当您向数据集添加点时,人们会期望直方图和拟合的 pdf 越来越接近(对于选择良好的 bin 数量)。

    【讨论】:

      猜你喜欢
      • 2013-09-08
      • 2017-08-15
      • 2010-11-09
      • 1970-01-01
      • 2022-01-19
      • 2012-01-07
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多