【发布时间】:2018-02-10 02:18:46
【问题描述】:
我正在将 TSV 文件导入 R,但某些选项卡位于错误的位置。例如,我想要:
Name Appointment
John Doe 12:30
Jane Doe 1:00
Rick Smith 11:45
Susy Smith 10:15
但是我得到了
Name Appointment
John Doe 12:30
Jane Doe 1:00
Rick Smith 11:45
Susy Smith 10:15
没有真正的模式,因为它是用户错误。我开发了一种解决方法,使用 substr() 来提取约会时间,但后来我失去了姓氏。
我也试过
separate(Data, col = Appointment, c("last", "time"), " ")
并从那里开始工作,但这也不起作用,因为姓氏和时间之间的空格数是可变的,并且格式不一致:
Name Last Time
John Doe 12:30
Jane Doe 1:00
Rick Smith 11:45
Susy Smith
对不起,如果这是一个愚蠢的问题!
【问题讨论】:
-
你绝对应该改变你的导出,这样你要么有一个适当的分隔符分隔逻辑字段,要么在可能有空格的单个术语周围加上引号。从我的角度来看,这不是 R 问题,您的源数据是罪魁祸首。
标签: r csv data-cleaning