【发布时间】:2020-06-16 18:14:50
【问题描述】:
我正在清理我的数据库“Visitas”,因为它是由每周来医院一次的患者组成的,所以我重复了很多次相同的主题,而我只是有兴趣将患者考虑一次。
我使用unique() 函数获取“真实”患者数量,但现在无法从原始数据库中获取。
我尝试使用这些情况创建一个向量,然后使用 which() 来获取索引,但它不起作用。
我在下面留下一些代码。
# Visitas_act: active patients who are still going to the hospital
# Visitas_mod: the initial 'Visitas' database but almost cleaned.
# codeep: patient code, identifier
Visitas_mod <- Visitas_mod[Visitas_act, ]
unique(Visitas_mod[, 'codeep'])
Visitas_r <- unique(Visitas_mod[, 'codeep'])
我试过了,但它不起作用,因为索引在“Visitas_mod”数据库中不匹配
tut <- which(Visitas_mod[, 'codeep'] == Visitas_r)
Visitas_mod <- Visitas_mod[tut, ]
【问题讨论】:
-
嗨@CarlosPascualBosch,我不太明白你想要做什么。因此,使用
Visitas_r,您可以获得一个唯一的患者代码向量。您需要原始数据框中的什么?当右侧是向量时,您不能使用 == 。你可以使用 %in% 但是.. 我还是不明白你的逻辑 -
已回答但感谢您的关注。我的目的是获取“Visitas_r”患者的索引,即不重复的代码患者(codeep),以便从原始数据库“Visitas_mod”中提取它们以仅与活动患者一起使用。对不起我的表达。