【发布时间】:2018-02-06 03:00:17
【问题描述】:
R 的新手,我有一个关于数据清理的问题。
我有一列包含汽车的驱动类型 - 四轮、全轮、两轮等
问题是没有标准化,所以有些行有四轮驱动、四轮驱动、四轮驱动、四轮驱动等
第一步很简单,即将所有内容都大写,但我遇到问题的步骤是将每个值更改为标准,例如 4WD,而无需重新编码每个独特的驱动器。
类似于 For Each 列中的值,如果值 LIKE/CONTAINS "FOUR" 更改为 "4WD"。
我研究了 recode 和 stringdist 和 mutate,但找不到合适的。当我输入它时,听起来我需要一个循环,但不确定确切的语法。
如果解决方案可以与 tidyverse 一起使用,那就太好了!
【问题讨论】:
-
建议查看
match()以帮助解决此问题。 -
@RobJensen 看起来不错。真的需要一些喜欢/包含的东西,这似乎就是它的作用。我会试试那个
标签: r data-cleaning