【发布时间】:2020-10-27 20:17:27
【问题描述】:
鉴于世界卫生组织发布的女孩长度百分位数数据。这是某些月份的长度(以厘米为单位)。例如出生时 50% 的百分位数是 49.1 厘米。
Month L M S SD P01 P1 P3 P5 P10 P15 P25 P50 P75 P85 P90 P95 P97 P99 P999
0 1 49.1477 0.0379 1.8627 43.4 44.8 45.6 46.1 46.8 47.2 47.9 49.1 50.4 51.1 51.5 52.2 52.7 53.5 54.9
1 1 53.6872 0.0364 1.9542 47.6 49.1 50 50.5 51.2 51.7 52.4 53.7 55 55.7 56.2 56.9 57.4 58.2 59.7
2 1 57.0673 0.03568 2.0362 50.8 52.3 53.2 53.7 54.5 55 55.7 57.1 58.4 59.2 59.7 60.4 60.9 61.8 63.4
3 1 59.8029 0.0352 2.1051 53.3 54.9 55.8 56.3 57.1 57.6 58.4 59.8 61.2 62 62.5 63.3 63.8 64.7 66.3
P01 是 0.1% 的百分位,P1 是 1% 的百分位,P50 是 50% 的百分位。
比如说,我有一个特定的(可能是小数)月份,比如 2.3 个月。 (身高测量将在出生后的特定天数进行,您可以将其除以 30.4375 得到小数月份)
我将如何在一个小数月内估算特定高度的百分位数?也就是说,不仅仅是看到它“在 P50 旁边”,而是说,那是关于“P62”
我想到的一种方法是进行线性插值,首先在第 2 个月和第 3 个月之间在所有固定百分位值之间进行。然后在这些时间插值的 P50 和 P75(或有数据的那两个百分位数)值之间进行线性插值。
我担心的是,因为这是一条钟形曲线,所以靠近中间的线性值可能离得太远而无法使用。
所以我在想,是否有一些公式,例如一条四边形曲线,您可以将其与固定的百分位值一起使用,然后针对给定的测量值在该曲线上获得精确值?
【问题讨论】:
-
这看起来更像是一个Mathematics 问题,而不是一个编程问题。
-
非常有趣的问题。这是一个二维插值问题。棘手的是确保插值的行为与基础数据的预期一致。特别是插值必须按月和百分位数增加。我能看到的最简单的方法是将数据分解成三角形(而不是正方形),找到新点落入的三角形,构造由下式确定的表面周围的点,并在该表面上进行评估。这是简单线性插值的二维模拟。
-
Cocoanetics,我不知道你是否找到了答案。无论如何,我一直在研究,它看起来像是一个标准的事情,这可能是你建议的,在一个方向上进行线性插值,然后在另一个方向上进行第二次线性插值,称为bilinear interpolation。事实证明,这实际上是一个插值二次曲线(特别是双曲面)。希望这会有所帮助。
标签: math statistics