【问题标题】:Is it possible to apply grid search to unsupervised isolation forest in H2O?是否可以将网格搜索应用于 H2O 中的无监督隔离森林?
【发布时间】:2020-10-07 18:26:08
【问题描述】:

我正在尝试将网格搜索应用于 R 中的 H2O 无监督隔离森林。这是我的代码:

Accesses.hex <- as.h2o(Accesses)

x <- names(Accesses.hex)

seed <- 12345

 

# Model hyperparameters

hyper_params <- list(ntrees = c(50, 100, 150, 200),

                       max_depth = c(8, 15, 20, 30), # default is 8

                       sample_size = c(128, 256, 512))


# Early stopping criteria

search_criteria <- list(strategy = "RandomDiscrete",

                          max_models = 100,

                          max_runtime_secs = 4000,

                          stopping_rounds = 15,

                          seed = seed)

 

model.grid <- h2o.grid(algorithm = "isolationForest",

                         x = x,

                         grid_id = "model_grid",

                         training_frame = Accesses.hex,

                         hyper_params = hyper_params,

                         search_criteria = search_criteria,

                         seed = seed)

但是,我收到一条错误消息:

h2o.grid 中的错误(算法 = “isolationForest”,x = x,grid_id = “model_grid”,:

必须指定响应,是的

我在这里使用隔离森林进行无监督学习,所以我没有响应变量 y。在这种情况下是否可以在 H2O 中进行网格搜索?

我的电脑:OS X 10.14.6,16 GB 内存

H2O cluster version:        3.30.0.1

H2O cluster total nodes:    1

H2O cluster total memory:   15.00 GB

H2O cluster total cores:    16

H2O cluster allowed cores:  16

H2O cluster healthy:        TRUE

R Version:                  R version 3.6.3 (2020-02-29)

如果我可以提供任何其他信息,请告诉我。感谢您的帮助!

【问题讨论】:

    标签: r machine-learning h2o


    【解决方案1】:

    由于当前设计没有目标列,因此无法正常工作。根据this Jira,具有网格搜索支持的隔离林目前正在开发中,并计划与 3.30.1.1 一起发布。

    【讨论】:

    • 谢谢尼玛!这很有帮助!它在该网页上显示“当前(3.26.0.6)您无法在隔离林上运行网格搜索。一种选择是更新隔离林实现,以便它可以支持带有响应列的验证数据集。”这是否意味着 3.30.1.1 中支持网格搜索的隔离林将需要验证数据集中的响应列?谢谢!
    • 它应该不需要响应列。在 3.30.1.1 支持网格搜索之前,您可以尝试使用 for 循环来获得所需的内容。
    • 感谢尼玛的建议!我正在考虑这样做,但我无法在 H2O 隔离林的输出中找到一个指标来衡量哪个模型是最好的。你对此有什么建议吗?非常感谢!
    • Neema,我在stackoverflow.com/questions/62516100/… 中发布了另外两个问题。其中之一是我刚刚在这里提出的问题。如果您有任何建议,请在该帖子下提供。谢谢!
    猜你喜欢
    • 2018-05-25
    • 2020-01-14
    • 2014-09-25
    • 1970-01-01
    • 2015-05-04
    • 2022-01-04
    • 2021-01-10
    • 1970-01-01
    • 2020-10-07
    相关资源
    最近更新 更多