【发布时间】:2017-02-08 23:46:30
【问题描述】:
是否可以在 Spark 中运行混合效应回归模型? (就像我们可以在 R 中使用 lme4、在 Julia 中使用 MixedModels 或在 Python 中使用 Statsmodels MixedLM)。
任何例子都会很棒。
我读过有一个 GLMix 函数,但我不知道用户是否可以直接使用它来拟合模型并获取系数和 p 值,或者它是否只能由机器学习库在内部使用。
我想迁移到 Spark,因为我的数据集比内存大得多。
是否有任何其他通用数据库或框架能够执行类似从磁盘流式传输数据的操作?
我只看到一些能够进行简单的线性回归。
问候
【问题讨论】:
标签: apache-spark regression mixed-models