【发布时间】:2019-01-22 00:02:29
【问题描述】:
我是健康科学专业的数据科学初学者。我正在尝试清理我的数据集,然后再将其用于分析。
我有 R 的初学者经验,在将字符串转换为数值时需要一些帮助,以便我可以对变量进行分析。
在公开可用的数据中,有一个字符变量,它以李克特量表询问人们对医疗保健系统的看法,但其在数据集中的编码方式是“1 - 糟糕;2;3;4;。 .. 10 - 优秀”
我只想:
1) 将“1 - 可怕”转换为“1”,与 10 相同。
2)我还想省略所有“不知道/拒绝”——从我的分母中删除它。
我进行了一些初步搜索,发现了一些函数 (strsplit),但我在将其应用到我的情况时遇到了困难
【问题讨论】:
-
嗨,欢迎来到 SO!请查看how to ask 以及如何提供良好的reproducible example,因为这使得提供答案变得更加容易。在这种情况下,如果您尝试使用
strsplit但没有成功,那么错误是什么? -
如果您提供几行数据集,显示响应可以采用的所有值,将会有所帮助。或者将我们指向在线数据,因为它是公开可用的。
-
感谢您的欢迎和回复。我还没有编写任何代码,因为我不太确定如何使用 strsplit 的功能。我正在使用 R Markdown,通常在编写代码之前,我会阅读如何理解一段代码然后应用它。但是,我无法理解它,以及如何使用该功能。我已经加载了我的数据集,为每个变量创建了摘要和表格。然而,清洁是我卡住的地方。任何建议或帮助表示赞赏。
-
neilfws,谢谢你的好点子,它位于:open.canada.ca/data/dataset/… 及其变量:Q2 和 Q3,我试图将其从字符转换为数字。