【发布时间】:2020-07-17 14:31:35
【问题描述】:
我正在处理一个包含大约 200 个变量的高维数据集。其中许多变量的值为 -99,表明它们是缺失值。我想将所有这些缺失值转换为 NA 而不是 -99。
我知道你可以做类似的事情
df$var1[df$var1 == -99] <- NA
但是当你有大量的变量时,这会变得非常累人,而且非常乏味和耗时。我正在将我的数据作为数据框导入并使用它。是否有一些我可以做的聪明的循环构造或我可以使用的一些不错的包/命令?我对在 RStudio 中编程还是有点陌生。谢谢!
【问题讨论】:
-
您可以在导入数据时指定。至少从
data.table::fread我知道你可以提供一个值向量来解释为NA。该参数称为na.strings
标签: r dataframe data-cleaning data-conversion