【发布时间】:2011-11-20 19:32:49
【问题描述】:
我有一组点 (x, y),其中每个 y 的误差范围为 y.low 到 y.high。假设线性回归是合适的(在某些情况下,数据可能最初遵循幂律,但已将 [log, log] 转换为线性)。
计算最佳拟合线很容易,但我需要确保该线在每个点的误差范围内。如果回归线超出范围,而我只是将其向上或向下推以保持在两者之间,这是可用的最佳拟合,还是斜率也需要更改?
我意识到在某些情况下,1 个点的下限和另一个点的上限可能需要不同的斜率,在这种情况下,大概只触及这 2 个边界是最合适的。
【问题讨论】:
-
是什么让您认为您的数据集和给定的错误界限甚至存在这样的拟合?
-
嗯,不能保证,所以我需要检查它不存在的情况。然而,由于数据被认为是从这样的公式生成的,然后四舍五入(每个点的精度不同),它很可能存在。我基本上是对这些数据表进行逆向工程,以找到原始公式。
-
请让我们知道您对我们的期望(一种一次性解决此问题的方法?一个集成到您的代码中的库(什么语言)?一种编码算法你自己?)
-
我不希望任何库都能做到这一点,我希望它是通用的,而不是一个孤立的。首先,问题是简单地调整最佳拟合的截距是否会产生最佳约束拟合,或者这种最佳约束拟合也可能具有不同的斜率?如果它只是一个截距调整,那是我可以处理的一个相当微不足道的解决方案。如果需要一个新的斜率,用什么数学方法来处理?