【发布时间】:2018-06-09 23:25:16
【问题描述】:
我有一个熊猫数据框,它有两列,一列是温度,另一列是时间。
我想创建第三列和第四列,分别称为 min 和 max。这些列中的每一列都将用 nan 填充,除非存在局部最小值或最大值,否则它将具有该极值的值。
这是数据的样例,基本上我试图识别图中的所有峰值和低点。
是否有任何带有 pandas 的内置工具可以做到这一点?
【问题讨论】:
-
结果是否应该对噪声具有鲁棒性?否则,您可以将 Series 的值与其班次进行比较。
-
在这种情况下我不担心噪音,如果是噪音信号我会过滤然后在过滤结果中寻找最大/最小
-
您也可以将一个非常简单的模型(例如具有一个或两个协变量的线性模型)拟合到数据中,然后从残差项中保留那些偏差在
q% 最小或最大类别中的模型,使用pd.quantile。
标签: python pandas dataframe numpy time-series