【发布时间】:2018-08-29 05:42:34
【问题描述】:
假设我有这个数组 A:
array([ 0.0019879 , -0.00172861, -0.00527226, 0.00639585, -0.00242005,
-0.00717373, 0.00371651, 0.00164218, 0.00034572, -0.00864304,
-0.00639585, 0.006828 , 0.00354365, 0.00043215, -0.00440795,
0.00544512, 0.00319793, 0.00164218, 0.00025929, -0.00155575,
0.00129646, 0.00259291, -0.0039758 , 0.00328436, 0.00207433,
0.0011236 , 0.00440795, 0.00164218, -0.00319793, 0.00233362,
0.00025929, 0.00017286, 0.0008643 , 0.00363008])
如果我跑:
np.histogram(A, bins=9, density=True)
据我所知:
array([ 34.21952021, 34.21952021, 34.21952021, 34.21952021,
34.21952021, 188.20736116, 102.65856063, 68.43904042,
51.32928032])
手册说:
"如果为True,则结果为概率密度函数的值 在 bin 处,归一化,使得范围内的积分为 1。 请注意,直方图值的总和不等于 1 除非选择了统一宽度的箱;它不是概率质量 函数。”
我以为我对直方图和密度函数有很好的理解,但我真的不明白这些值代表什么或如何计算它们。
我需要用 R 重现这些值,因为我正在两种语言之间移植一些代码。
【问题讨论】:
-
开源软件的好处之一是,如果您不知道某些东西是如何计算的,您可以随时have a look yourself。
-
感谢您提供的链接,这很有趣,但我认为现在调查该功能的内部构建方式超出了我的范围。
标签: python r histogram probability-density