【问题标题】:Platform-independent random state in scikit-learn train_test_splitscikit-learn train_test_split 中与平台无关的随机状态
【发布时间】:2021-07-02 22:43:19
【问题描述】:

在使用 scikit-learn 拆分训练/测试数据集时是否设置特定的随机种子 (random_state) 会产生相同的随机数生成器初始化(即,产生相同的伪随机数)在不同平台上 - 例如,通过不同的云计算实例?

谢谢!

【问题讨论】:

标签: python random scikit-learn platform seed


【解决方案1】:

只要random_state 在所有平台上都相等,并且它们都运行相同版本的 numpy,您应该得到完全相同的拆分。

由于random_state 是一个numpy 实例,我认为scikit-learn 的所有伪随机数生成器都被冻结了,因为numpy 冻结了RandomState

您可以查看random_state here 的文档,您可以看到numpy.random.RandomState。可以查看numpy的兼容性保证here

【讨论】:

    猜你喜欢
    • 2017-06-30
    • 2020-01-05
    • 2017-03-26
    • 2023-03-06
    • 2020-07-14
    • 2015-07-14
    • 2018-05-18
    相关资源
    最近更新 更多