【问题标题】:How to identify breaking points in a numeric array in MATLAB如何在 MATLAB 中识别数值数组中的断点
【发布时间】:2014-09-12 09:13:29
【问题描述】:

大家下午好,我有一个新问题,希望您能再次帮助我:

我有一个矢量,您可以在下一个链接中找到它:

https://drive.google.com/file/d/0B4WGV21GqSL5Y09GU240N3F1YkU/edit?usp=sharing

绘制的矢量如下所示:

如您所见,图表中有一些部分的数据行为几乎是线性的。这就是我要说的:

我需要的是根据数据中某些部分的线性度找到那些断点。你可能会问自己,当数据的一部分不是线性的时会发生什么,好吧,算法不会处理那部分。

希望你能帮助我,谢谢。

【问题讨论】:

  • 使用diff 计算二阶导数(斜率的变化)并查看它何时超过某个阈值(理想情况下为 0,但取决于数据的噪声程度,情况并非如此) .
  • 并在某个阶段应用低通滤波器以平滑结果,否则二阶导数将包含很多“噪声”

标签: matlab data-analysis adjustment


【解决方案1】:

您正在尝试做的是分段线性时间序列分割。

有很多方法可以解决这个问题,它们的复杂性和准确性各不相同。

这里是最简单的一种,叫做滑动窗口分割:

function [breaks vals] = segment( data, max_error )
    breaks = [];
    vals = [];
    left = 1;
    for right = 2:length(data)
        err = linear_regresion(data(left:right));
        if max(abs(err)) > max_error
            breaks(end+1) = right-1;
            vals(end+1) = data(right-1);
            left = right;
        end
    end
end

function err = linear_regresion( data )
    n = length(data);
    x = (1:n)' - (n+1)/2;
    y = data - mean(data);
    k = sum(x.*y) ./ sum(x.^2);
    err = y - k*x;
end

linear_regresion 这里是simple linear regression algorithm 的实现。

在我的示例中,我使用最大绝对误差作为停止标准,但您可以将其替换为任何其他拟合函数,例如mean squared error.

以下是使用max_error = 0.04 分割数据的示例:

您可以在this survey paper 中找到有关此分割技术和其他分割技术的更多信息。

【讨论】:

  • 我无法让它变得更好,非常感谢!
猜你喜欢
  • 2016-01-19
  • 1970-01-01
  • 2021-09-18
  • 1970-01-01
  • 2020-09-26
  • 2018-11-23
  • 2016-04-25
  • 2015-05-22
  • 1970-01-01
相关资源
最近更新 更多