【问题标题】:Time Weighted Samples when using Random Forest使用随机森林时的时间加权样本
【发布时间】:2018-12-25 20:03:28
【问题描述】:

我想知道是否存在按时间对随机森林的训练样本进行指数加权的最佳做法(对最近的样本赋予更多权重)?我能想到的一种方法是根据给定时间的权重对完整的数据集进行替换。还有其他我应该考虑的方法吗?如果有人知道一些可以帮助我实现这个目标的 python 包,那就太好了。非常感谢任何帮助!

【问题讨论】:

  • 欢迎来到 StackOverflow!为了帮助其他人更好地回答您的问题,请尝试针对特定问题提出问题,最好使用一些源代码。正如on-topic 帮助页面中所写,“要求我们推荐或查找书籍、工具、软件库、教程或其他非现场资源的问题对于 Stack Overflow 来说是题外话。”

标签: random-forest


【解决方案1】:

随机森林的 sklearn 实现允许在 fit function 中指定样本权重。

from sklearn.ensemble import RandomForestClassifier
# fill sample_weight with the desired weighting
sample_weights = numpy.ones(y.shape)
estimator = RandomForestClassifier
estimator.fit(X, y, sample_weights)

【讨论】:

    猜你喜欢
    • 2019-11-13
    • 2022-12-17
    • 1970-01-01
    • 2017-05-13
    • 2017-12-10
    • 2016-06-27
    • 2016-01-21
    • 2015-09-05
    • 1970-01-01
    相关资源
    最近更新 更多