【发布时间】:2021-07-12 18:34:11
【问题描述】:
我刚刚发现了这个,我有兴趣探索使用 SQL 存储来计算我的一些学习器输出。我认为数据库调用可能比基础 R 或 Python 快得多。
很棒的小插曲: http://cran.nexr.com/web/packages/tidypredict/vignettes/randomForest.html
基本代码:
require(pacman)
p_load(randomForest, tidypredict, dbplyr)
model <- randomForest(Species ~ .,data = iris ,ntree = 10, proximity = TRUE)
tidypredict_sql(model, dbplyr::simulate_mssql())
它提供了每棵树的 SQL 代码,然后我可以使用该模式聚合这些代码以获得估算器输出。
那么如何将它与 h2o.ai 之类的东西一起使用,尤其是 h2o.randomForest 之类的东西?
【问题讨论】: