【发布时间】:2021-09-16 07:20:52
【问题描述】:
我想知道如何/是否可以为大型数据集运行 sklearn 模型/xgboost 训练。 如果我使用包含几个千兆字节的数据帧,机器会在训练期间崩溃。
你能帮帮我吗?
【问题讨论】:
标签: scikit-learn xgboost sklearn-pandas
我想知道如何/是否可以为大型数据集运行 sklearn 模型/xgboost 训练。 如果我使用包含几个千兆字节的数据帧,机器会在训练期间崩溃。
你能帮帮我吗?
【问题讨论】:
标签: scikit-learn xgboost sklearn-pandas
scikit-grood文档有一个in-depth discussion关于不同的策略,将模型缩放到更大的数据。 策略包括:
【讨论】:
xgb_model执行增量学习。 span>