【问题标题】:Creating a synthetic dataset for logisitc regression model in R在 R 中为逻辑回归模型创建合成数据集
【发布时间】:2021-04-19 17:01:24
【问题描述】:

我正在尝试为200 样本的随机创建点创建(合成)数据集。问题是我得到了重复的列名,但我的要求是我只想要一个 targety

这是我的方法:

#For samples
library(mvtnorm)
library(fontawesome)
a1 <- c(1, 0)
a2 <- c(0, 1)
M <- cbind(a1, a2)

C0 <- rmvnorm(100, c(0, 0), M)
C1 <- rmvnorm(100, c(5, 0), M)

#Creating synthetic dataset
dat <- rbind(C0, C1)
y <- sign(-1 - 2 * x1 + 4 * x2 )
y[y == -1] <- 0
df1 <- cbind.data.frame(y, C)
df1

想知道我的流程出了什么问题

df1 的输出

【问题讨论】:

  • 这一步看不懂sign(-1 - 2 * C)
  • @akrun 我编辑了,它基本上是一个符号函数,它确定变量的符号并相应地将其分配给列
  • 您期望输出什么。是不是只有3列
  • 在你的编辑中,有y &lt;- sign(-1 - 2 * x1 + 4 * x2 ) x1和x2,没有定义
  • 是的,现在已经解决了。我现在能够生成一个包含 200 个样本的数据集,其中一个目标变量为 1 或 0

标签: r logistic-regression sample


【解决方案1】:

如果需要从 'dat' 创建 'y'

 y <- sign(-1 - 2 * dat[,1] + 4 * dat[,2] )

现在,'df' 将是

head(df1)
#   y         X1         X2
#1 0 -0.7846368  0.2959261
#2 0  1.6764476  0.8565073
#3 0 -0.9609016 -0.2585588
#4 0  0.5455316  0.2600099
#5 1 -1.5251354  0.2887918
#6 0 -0.1563197  0.2524742

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-07-01
    • 2022-01-12
    • 1970-01-01
    • 1970-01-01
    • 2017-04-13
    • 2021-04-28
    • 2018-01-26
    • 2013-08-27
    相关资源
    最近更新 更多