【发布时间】:2021-03-21 13:58:47
【问题描述】:
我在相同的数据上运行随机森林,得到了不同的结果。根据this article,原因是:
由于学习算法的性质,当您对相同的数据运行相同的算法时,您可能会得到不同的结果。有些算法不是确定性的;相反,它们是随机的。这意味着他们的行为包含了随机性元素。
然后提到我们可以通过以下方式处理它:
您设置了伪随机数生成器使用的种子,以确保每次运行算法时,都获得相同的随机性。
我不确定在这种情况下如何控制伪随机数? 此外,我在改组我的数据帧时使用随机状态,因此将确保每次都以相同的方式进行改组,但这与通过 seudorandom 数生成器控制模型无关。对吧?
df = df.sample(frac=1,random_state = 524).reset_index(drop=True)
【问题讨论】:
-
你在使用 scikit-learn 吗?您能否提供一些示例代码来展示您如何训练随机森林模型?
标签: python random-forest