【发布时间】:2018-06-27 20:57:57
【问题描述】:
我想在我的模型中为 1 个自变量创建虚拟变量。下面是我的数据集的外观示例。Y 是我的因变量,Var1、Var2、Var3 是自变量。
数据集:
Y Var1 Var2 Var3 1 30 N3 45 0 43 N2 56 0 56 N2 76 1 67 N1 89 0 77 N2 99
期望的输出: Y Var1 Var2 Var3 1 30 0 45 0 43 1 56 0 56 1 76 1 67 2 89 0 77 1 99
我们可以使用循环来运行它,因为我们有 3 个独立的。变量?如果有人指导我完成 R 代码会很有帮助吗?
如何将分类变量转换为连续变量以应用回归。如何为 Var2 创建虚拟变量
【问题讨论】:
-
如果您提供a complete minimal reproducible example 来回答您的问题,我们更有可能为您提供帮助。我们可以从中工作并使用它来向您展示如何回答您的问题。我还建议看看how do I ask a good question。证明你已经付出了一些努力通常是件好事。
-
基本上答案是“不要这样做”。您不需要在 R 中创建虚拟变量。查看因子函数。这是基本的 R 概念,所以你应该回到你正在学习的任何文本,并找出如何定义因子和水平。事实上,如果您使用任何 read.* 函数来创建数据框,变量 Var2 已经是一个因子类。默认情况下,这些函数和
data.frame中的 stringsAsFactors 为 TRUE
标签: r regression linear-regression