【发布时间】:2011-03-18 21:20:34
【问题描述】:
我正在编写一个输出 .csv 文件的调查。在这个 csv 中,我有一些以空格分隔的条目,它们代表多选问题(例如,具有多个响应的问题)。最后,我想将这些以空格分隔的条目解析到它们自己的列中,并为它们创建标题,这样我就知道它们来自哪里。
例如,我可以从这个开始(注意多选列后面有一个 _M):
Q1, Q2_M, Q3, Q4_M
6, 1 2 88, 3, 3 5 99
6, , 3, 1 2
我想去这个:
Q1, Q2_M_1, Q2_M_2, Q2_M_88, Q3, Q4_M_1, Q4_M_2, Q4_M_3, Q4_M_5, Q4_M_99
6, 1, 1, 1, 3, 0, 0, 1, 1, 1
6,,,,3,1,1,0,0,0
我想这是一个相对常见的问题,但我无法在 R 部分找到它。导入 .csv 后如何在 R 中执行此操作有什么想法吗?我的一般想法(通常会导致程序效率低下)是我可以: (1) 用 grep() 拉取具有特殊后缀的列号 (2) 遍历(或使用应用)这些列中的每个条目并确定响应级别,然后相应地创建列 (3) 循环(或使用应用)并在适当的列中放置指示符以指示存在选择
感谢您的帮助,如果不清楚,请告诉我。
【问题讨论】:
-
可能的“多重选择”答案是否有限?你事先认识他们吗?如果是这样,这将变得容易得多。
-
是的,它们是有限的,是的,可能的选择是预先知道的。