【发布时间】:2014-02-27 06:03:30
【问题描述】:
从另一个线程(@EnricoGiampieri's answer 到cumulative distribution plots python)那里得到一个提示,我写道:
# plot cumulative density function of nearest nbr distances
# evaluate the histogram
values, base = np.histogram(nearest, bins=20, density=1)
#evaluate the cumulative
cumulative = np.cumsum(values)
# plot the cumulative function
plt.plot(base[:-1], cumulative, label='data')
我在 np.histogram 上的文档中输入了密度=1,其中说:
"请注意,除非选择了统一宽度的 bin,否则直方图值的总和不会等于 1;它不是概率质量函数。"
嗯,确实,当绘制它们时,它们的总和不等于 1。但是,我不理解“单位宽度的箱”。当然,当我将 bin 设置为 1 时,我得到一个空图表;当我将它们设置为人口规模时,总和不会为 1(更像是 0.2)。当我使用建议的 40 个垃圾箱时,它们的总和约为 0.006。
谁能给我一些指导?谢谢!
【问题讨论】:
-
面积之和是一吗?
-
我猜是的。保罗,我很抱歉——我的统计数据很弱。我正在从一个 R 示例开始工作,其中 y 轴值从 0 到 1,CDF 上限为 1。
-
(如果我知道怎么做,我会发布一个屏幕截图。)曲线上限为 0.2,但超过 2000-8000 的 x 值,所以我相信该区域会是 1。
-
对我来说,当我有来自
np.arange(0, 1005, 10)的垃圾箱时,我只需要全部乘以 10。我还没有检查过,但似乎你只需要将密度乘以差异因子,即 10在我的场合