【问题标题】:How to detect anomalies in multivariate, multiple time-series data?如何检测多变量、多时间序列数据中的异常?
【发布时间】:2020-09-04 02:33:06
【问题描述】:

我试图在拥有数千个独特客户的庞大销售交易数据集(超过 100 万次观察)中发现异常情况。同一客户可以在同一日期多次购买。数据集包含随机和季节性交易的混合。我的数据的虚拟样本如下:

Date      CustomerID     TransactionType      CompanyAccountNum      Amount
01.01.19  1              Sales                111xxx                 100
01.01.19  1              Credit               111xxx                 -3100
01.01.19  4              Sales                111xxx                 100
02.01.19  3              Sales                311xxx                 100
02.01.19  1              Refund               211xxx                 -2100
03.01.19  4              Sales                211xxx                 3100

哪种算法/方法最适合这个问题?到目前为止,我已经尝试了一个多元 FBprophet 模型(在 python 上),但结果并不令人满意。

【问题讨论】:

    标签: python machine-learning time-series outliers anomaly-detection


    【解决方案1】:

    如果您有时间序列数据,最好应用移动平均或指数平滑数据等方法来消除趋势和季节性。否则,所有涉及季节性或趋势周期的数据点都将被标记为异常。

    【讨论】:

      【解决方案2】:

      您可以尝试pyod 包,隔离森林或HBOS 等方法。

      它被宣传为“用于检测多元数据中的离群对象的全面且可扩展的 Python 工具包”,但您的里程可能会因性能而异,因此请先查看他们的 benchmarks

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2021-02-19
        • 1970-01-01
        • 2022-01-11
        • 2018-07-11
        • 2021-04-12
        • 1970-01-01
        • 2013-03-31
        • 2013-10-09
        相关资源
        最近更新 更多