【问题标题】:Is it possible to dynamically adjust contamination parameter in Isolation Forest?隔离森林中是否可以动态调整污染参数?
【发布时间】:2021-01-10 23:58:10
【问题描述】:

我使用隔离森林构建了一个异常检测模型,默认设置为污染参数 (0.1)。它在我当前的数据集上工作得很好,但是现在我有不同的文件具有相同的结构但不同的行数,一旦我运行模型,我不再获得准确的结果,而无需通过手动调整污染参数,直到它适合.

我想在获得新文件后立即自动运行模型,但我的数据中异常值的百分比在每个文件中各不相同,而且由于我总是必须更改污染参数,因此不可能获得好的结果。有没有办法在每次新文件到达时计算一个新参数,或者这个模型不适合我的用例?

【问题讨论】:

  • 据我所知,您无法在线调整参数,但是您可以计算一些平均值并使用它。

标签: python machine-learning outliers unsupervised-learning anomaly-detection


【解决方案1】:

contamination 参数是一个超参数。可以使用hyperparameter optimization 进行调整。使用小型模型/数据集的 scikit-learn 中的典型方法是使用网格搜索,请参阅user guide。这假设您有一种可靠的量化方法来评估您的模型性能。

【讨论】:

  • 感谢您的回答。能否请您看一下相关帖子here
猜你喜欢
  • 2020-12-17
  • 2020-01-14
  • 1970-01-01
  • 2023-03-05
  • 2018-09-10
  • 2019-07-11
  • 2019-07-20
  • 1970-01-01
  • 2020-11-16
相关资源
最近更新 更多