【发布时间】:2020-03-06 15:22:57
【问题描述】:
我是一名初级 R 程序员,在 R Studio 中使用 tidyverse 和 skimr 库。我在计算相关性(得到“NA”作为响应)时遇到问题,我认为这是因为我的一个变量缺少值。
这是我尝试的关联:
cor(baby_data$mother_age, baby_data$father_age)
这些是我尝试过的一些事情(但没有奏效)摆脱了父亲年龄中的 NA:
mutate(updated_dad_age = father_age %>%
drop_na())
cor(baby_data$mother_age, baby_data$father_age, na.rm = TRUE)
有谁知道如何去除一个变量father_age中的NA,以便我可以计算相关性?
【问题讨论】:
-
如果您共享数据样本,例如使用 dput(baba_data) 将有助于回答您的问题。通常这样的事情应该可以工作:
bd <- baby_data %>% drop_na()然后cor(bd$mother_age, bd$father_age)