【问题标题】:How do I draw a histogram for a normal distribution using python matplotlib?如何使用 python matplotlib 绘制正态分布的直方图?
【发布时间】:2020-05-21 17:47:13
【问题描述】:
我的问题是 - 使用 NumPy 函数 np.random.randn 为 100,000 点的正态分布生成数据 x。然后绘制直方图。
我的计算是 -
x = sp.norm.pdf(np.random.randn(100000))
plt.hist(x, bins = 20, facecolor='blue', alpha=0.5)
因为我无法获得正态分布的直方图,有什么问题吗?
【问题讨论】:
标签:
python
numpy
matplotlib
histogram
normal-distribution
【解决方案1】:
要从标准正态分布中获取 N 个随机样本,您可以使用 np.random.randn(N) 或 scipy 的 stats.norm.rvs(size=N)。然后这些样本可用于创建直方图。
要绘制曲线,可以使用stats.norm.pdf(y),其中y 是一系列后续x 值。这样的pdf 是标准化的,即图下方的面积为 1。直方图的总面积是样本数乘以 bin 的宽度(每个样本恰好落在一个 bin 中)。因此,将 pdf 乘以该因子会将其缩放到直方图的高度。
stats.norm.pdf(np.random.randn(N)) 的结果将是 N 个随机样本的概率列表。大多数样本最终会靠近曲线中心(y = 0),此处 pdf 的高度约为 0.40。这解释了该最大值附近的高峰值。
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
N = 100000
# x = np.random.randn(N)
x = stats.norm.rvs(size=N)
num_bins = 20
plt.hist(x, bins=num_bins, facecolor='blue', alpha=0.5)
y = np.linspace(-4, 4, 1000)
bin_width = (x.max() - x.min()) / num_bins
plt.plot(y, stats.norm.pdf(y) * N * bin_width)
plt.show()
【解决方案2】:
import numpy as np
import matplotlib.pyplot as plt
x = np.random.randn(100_000)
plt.hist(x, bins=20, facecolor="blue", alpha=0.5)
plt.show()
【解决方案3】:
'import numpy as np
import seaborn as sns
N = 1000
x = np.random.randn(N)
sns.histplot(x,bins=20,kde=True,color='red')'
histplot using seaborn