【发布时间】:2021-04-19 17:01:24
【问题描述】:
我正在尝试为200 样本的随机创建点创建(合成)数据集。问题是我得到了重复的列名,但我的要求是我只想要一个 target 列 y
这是我的方法:
#For samples
library(mvtnorm)
library(fontawesome)
a1 <- c(1, 0)
a2 <- c(0, 1)
M <- cbind(a1, a2)
C0 <- rmvnorm(100, c(0, 0), M)
C1 <- rmvnorm(100, c(5, 0), M)
#Creating synthetic dataset
dat <- rbind(C0, C1)
y <- sign(-1 - 2 * x1 + 4 * x2 )
y[y == -1] <- 0
df1 <- cbind.data.frame(y, C)
df1
想知道我的流程出了什么问题
【问题讨论】:
-
这一步看不懂
sign(-1 - 2 * C) -
@akrun 我编辑了,它基本上是一个符号函数,它确定变量的符号并相应地将其分配给列
-
您期望输出什么。是不是只有3列
-
在你的编辑中,有
y <- sign(-1 - 2 * x1 + 4 * x2 )x1和x2,没有定义 -
是的,现在已经解决了。我现在能够生成一个包含 200 个样本的数据集,其中一个目标变量为 1 或 0
标签: r logistic-regression sample