【发布时间】:2012-07-10 06:49:46
【问题描述】:
我是 R 新手,并试图在数据集(“数据”)中创建许多新变量。
在此数据集中,列是问题是否被回答的二分编码。问题编号用下标(“Q_1”、“Q_2”)表示。每个问题都有几个属性,我想使用相同的下标(即“Q_Attribute1_1”、“Q_Attribute2_1”)来命名,因为我需要重塑将数据转换成多级分析的长格式。但是因为我总共有 30 个问题,每个问题都有 18 个问题级属性,所以手动创建 540 个变量 (30x18) 似乎并不聪明。另外一个问题是,每个问题都与单个值,例如 0/1。
创建了两个向量——一个带有变量名称,一个带有关联值——我需要将每个唯一变量名称作为 columns 添加到更大的数据集(“main .data") 包含 20,000 个案例。我希望这个变量的值与上面数据中列出的所有情况下的值相同。这将如何实现?
【问题讨论】:
-
为什么不构建一个包含 5 个 Q 的小测试用例,每个 Q 有 3 个(短)属性?我想知道
expand.grid(Qs=unique(questions), attribs =unique(Attributes) )是否可以工作....但是您没有说每个问题的 hte 属性是否相同。 -
很抱歉。我确定是我的错! 540 个变量——每个变量都有 1 个对应的值。
标签: r