【发布时间】:2016-10-01 03:18:11
【问题描述】:
我有一个数据框,我需要根据两个变量对其进行净化,但两个变量在行中都是“准相同的”。这意味着他们可以在一行中有一个- 或' 或s 或: 或一个空格,但在另一行没有它。
我确实使用了unique(),但这个函数只适用于相同的值。假设我们有这个data.frame
Id<-c("RoLu1976","Rolu1976","AlBl1989","ThSa1996")
Art<-c("Econometric Policy Evaluation: A Critique","Econometric Policy Evaluations A Critique", "Rules after discretion", "Expectations and the Nonneutrality of Lucas")
Id.1<-c("FiKy1989","EdPr1986","BeBe1983","JoSt1989")
Art.1<-c("Notes on the Lucas Critique","Notes on the Lucas Critique","The Inconsistency of Optimal Plans","The Inconsistency of Optimal Plans")
N<-data.frame(Id,Art,Id.1,Art.1)
在两个第一次观察中,变量Art 中的准相同值是不同的,只是s 和: 不同。如何过滤和删除这些值?
【问题讨论】:
标签: r dataframe delete-row