【问题标题】:Error in Rose sampling when balancing data with categorical variables平衡数据与分类变量时 Rose 抽样中的错误
【发布时间】:2019-09-16 15:49:51
【问题描述】:

我正在尝试平衡我的数据,其中多数类别的比例为 99%,而稀有类别的比例为 1%。我的响应变量是二进制的,我的自变量是二进制、整数和分类变量。

我正在使用 ROSE 包的 ROSE 功能,但出现以下错误: “rose.sampl 中的错误(n,N,p,ind.majo,majoY,ind.mino,minoY,y,classy,: ROSE 的当前实现只处理连续变量和分类变量。”

我知道这个错误是因为我的自变量造成的,但我无法弄清楚这个错误的主要原因是什么以及如何解决它。你有遇到过这样的错误吗?

【问题讨论】:

  • 请提供一个可重现的问题示例。

标签: r oversampling


【解决方案1】:

我也收到了类似的信息。原来我的一个自变量是一个 difftime 对象,而它应该是数字的。

ROSE 包的文档声明它接受整数或数字格式的连续变量,以及因子格式的分类变量,因为它的 accuracy.meas 和 roc.curve 函数。 ROSE 函数可能是相同的。了解变量的类别会有所帮助,但请考虑分解您的二进制列或确保您的其他变量符合这些数据类型。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-07-18
    • 2015-09-09
    • 1970-01-01
    • 1970-01-01
    • 2021-01-16
    • 1970-01-01
    • 1970-01-01
    • 2018-05-14
    相关资源
    最近更新 更多