【发布时间】:2020-04-21 00:33:59
【问题描述】:
自从我使用 R 以来已经有一段时间了,所以很抱歉问了这么一个基本的问题:s
我有一个变量,其中包含相同 ID 的基线、4 个月和 12 个月的数据。我实际上是想弄清楚哪些 ID 在 4 个月内丢失了数据,因此我可以从整个数据集中删除这些 ID。
ID Baseline 4MOS 12MOS
123_ABC 53.5 NA NA
456_DEF 45.1 32.5 12.2
789_GHI 45.4 NA NA
923_JKL 88.4 11.1 23.1
734_BBB 45.4 20.1 NA
343_CHF 22.1 16.1 NA
我已经确定了缺少 4 个月数据的行号:
clean <- which(is.na(df$4MONTHS))
这是我后来尝试将 ID 返回给我的代码,但它只是给了我一条消息“错误:尝试应用非函数”:
clean <- list(df$ID(which(is.na(df$4MOS))))
非常感谢任何帮助:这个!
【问题讨论】:
-
应该全部丢失 4 Mos 还是 4Mos 中的任何丢失?
-
嗨@NelsonGon! 4MOS中只有部分ID有缺失数据(即123_ABC和789_GHI)。
-
当您使用运算符
$时,您可能会遇到第一个字符为数字的列名称的问题。尝试更改列名或使用语法df[, "4MOS"]选择列。
标签: r dataframe missing-data