【发布时间】:2019-09-16 15:49:51
【问题描述】:
我正在尝试平衡我的数据,其中多数类别的比例为 99%,而稀有类别的比例为 1%。我的响应变量是二进制的,我的自变量是二进制、整数和分类变量。
我正在使用 ROSE 包的 ROSE 功能,但出现以下错误: “rose.sampl 中的错误(n,N,p,ind.majo,majoY,ind.mino,minoY,y,classy,: ROSE 的当前实现只处理连续变量和分类变量。”
我知道这个错误是因为我的自变量造成的,但我无法弄清楚这个错误的主要原因是什么以及如何解决它。你有遇到过这样的错误吗?
【问题讨论】:
-
请提供一个可重现的问题示例。
标签: r oversampling