【问题标题】:scikit-learn fit remaining timescikit-learn fit 剩余时间
【发布时间】:2014-04-05 05:58:21
【问题描述】:

有没有办法在拟合模型时估计剩余时间?例如

model = sk.ensemble.RandomForestRegressor(n_estimators=10)
model.fit(x, y)

我有一个相当大的数据集(数百万行),这将需要一些时间,所以我想知道估计的时间,以便我可以做其他事情并在流程完成后返回。

对于像随机森林这样的集合,剩余时间的估计应该[合理]容易。

【问题讨论】:

    标签: python scikit-learn


    【解决方案1】:

    尝试verbose 选项。您可以将其更改为 0(无输出)、1(每个作业更新)和 2(每个树更新),例如

    model = RandomForestRegressor(n_estimators=100, verbose=2, n_jobs=2).fit(X_train, y_train)
    

    【讨论】:

    • 谢谢!这几乎正​​是我想要的!太糟糕了,仅在每个作业完成后才打印时间估计。有没有办法在每棵树建成后打印估算值?
    • 据我所知,我认为它不能给你时间估计,因为每个人的机器速度不同。但是,如果您知道创建一棵树需要多长时间,您就可以很好地估计创建所有树需要多长时间。您可以直接在他们的邮件列表中询问或在他们的 GitHub 页面 github.com/scikit-learn/scikit-learn 中提出新功能。
    • 谢谢,我想我会的。我自己为 Weka 创建了类似的时间估计(计算平均树创建时间并将其投影到未创建的树),并且由于多线程库已经在最后打印时间估计,它应该非常容易。
    • 卡在building tree 8 of 100 然后很久没有更新了。
    猜你喜欢
    • 2018-02-22
    • 2019-05-23
    • 2018-12-01
    • 2014-06-03
    • 1970-01-01
    • 2019-06-18
    • 2018-05-01
    • 1970-01-01
    • 2017-03-22
    相关资源
    最近更新 更多