【发布时间】:2020-08-26 22:08:43
【问题描述】:
我目前正在处理几个包含有关 5570 个巴西城市的信息的数据集,我经常需要按名称合并它们。但是碰巧有几个名称在各州之间重复(在 UF: 行中命名)。一个数据集的例子是:
<chr>
1 UF: Alagoas
2 IBATEGUARA
3 MARAGOGI
4 MESSIAS
5 PENEDO
6 PORTO CALVO
7 UF: Amazonas
8 APUI
9 HUMAITA
10 MANAQUIRI
我想要的是区分每个自治市属于哪个州:
<chr>
1 UF: Alagoas
2 IBATEGUARA (AL)
3 MARAGOGI (AL)
4 MESSIAS (AL)
5 PENEDO (AL)
6 PORTO CALVO (AL)
7 UF: Amazonas
8 APUI (AM)
9 HUMAITA (AM)
10 MANAQUIRI (AM)
有了这个,每个地方我都会有一个唯一的名字。我曾尝试使用mutate_at 并输入每个状态标识符之间的行,但我想要一种更简单的方法来跨不同的数据集执行此操作。如何修改两组行之间的所有字符串?
【问题讨论】:
-
是的,它们将类似于 Alagoas 的 AL 和 Amazonas 的 AM 等等。我想要的是专门将此缩写添加到每个市政当局的名称中。