【发布时间】:2015-11-17 18:23:18
【问题描述】:
我有一个包含两列的 data.frame:名称和索引以及 200 万行。
我确定所有索引都正确写入,但我需要验证“名称”列。
如何根据索引值更改所有名称值。
让我举个例子。假设我们有以下 data.frame 'db':
db
Index Name
1 Carlos
2 John
3 Bill
4 Mary
1 Cerlas
如图所示,“名称”对于每个索引值都应该相等,但有人写错了。
我将如何纠正它?是否有使用“dplyr”或“tidyr”的解决方案?
我尝试了以下代码,但没有成功。
for (i in unique(db$Index)) {
db$Nome[db$Index==i] <- db$Nome[db$Index==i][1]
}
谢谢
【问题讨论】:
-
我们如何知道哪个拼写正确?
-
@akrun 其实没关系
-
在这种情况下,发布一个解决方案。