隔离森林中是否可以动态调整污染参数？答案

【问题标题】：Is it possible to dynamically adjust contamination parameter in Isolation Forest?隔离森林中是否可以动态调整污染参数？
【发布时间】：2021-01-10 23:58:10
【问题描述】：

我使用隔离森林构建了一个异常检测模型，默认设置为污染参数 (0.1)。它在我当前的数据集上工作得很好，但是现在我有不同的文件具有相同的结构但不同的行数，一旦我运行模型，我不再获得准确的结果，而无需通过手动调整污染参数，直到它适合.

我想在获得新文件后立即自动运行模型，但我的数据中异常值的百分比在每个文件中各不相同，而且由于我总是必须更改污染参数，因此不可能获得好的结果。有没有办法在每次新文件到达时计算一个新参数，或者这个模型不适合我的用例？

【问题讨论】：

据我所知，您无法在线调整参数，但是您可以计算一些平均值并使用它。

标签： python machine-learning outliers unsupervised-learning anomaly-detection

【解决方案1】：

contamination 参数是一个超参数。可以使用hyperparameter optimization 进行调整。使用小型模型/数据集的 scikit-learn 中的典型方法是使用网格搜索，请参阅user guide。这假设您有一种可靠的量化方法来评估您的模型性能。

【讨论】：

感谢您的回答。能否请您看一下相关帖子here？