【问题标题】:Confused for the Code for over-sampling with R对使用 R 进行过采样的代码感到困惑
【发布时间】:2020-01-15 19:06:05
【问题描述】:

下面的代码是关于超过10个房间的房屋过采样,请问prob = ifelse(housing.df$ROOMS>10, 0.9, 0.01)是什么意思?非常感谢。

s <- sample(row.names(housing.df), 5, pro = ifelse(housing.df$ROOMS>10, 0.9, 0.01))
housing.df[s.]

【问题讨论】:

  • 你看帮助页了吗?ifelse

标签: r sample oversampling


【解决方案1】:

我想这个 ccode 的目的是首先检查数据集中给定的房子是否有十个房间。如果是这样,那么它的概率是 90%,否则它的概率是 10%

sample 使用此关联概率从给定房屋名称中抽取样本,因此在抽样时有利于那些有十个以上房间的房屋。这将创建您的过度样本。

这是你的意思吗?

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-07-12
    • 2012-10-05
    • 1970-01-01
    • 2020-11-23
    • 2010-10-28
    • 1970-01-01
    • 2013-03-29
    • 2015-11-21
    相关资源
    最近更新 更多