【发布时间】:2021-01-10 23:58:10
【问题描述】:
我使用隔离森林构建了一个异常检测模型,默认设置为污染参数 (0.1)。它在我当前的数据集上工作得很好,但是现在我有不同的文件具有相同的结构但不同的行数,一旦我运行模型,我不再获得准确的结果,而无需通过手动调整污染参数,直到它适合.
我想在获得新文件后立即自动运行模型,但我的数据中异常值的百分比在每个文件中各不相同,而且由于我总是必须更改污染参数,因此不可能获得好的结果。有没有办法在每次新文件到达时计算一个新参数,或者这个模型不适合我的用例?
【问题讨论】:
-
据我所知,您无法在线调整参数,但是您可以计算一些平均值并使用它。
标签: python machine-learning outliers unsupervised-learning anomaly-detection