如何将所有 <NotAvailable> 转换为 <NA> [重复]答案

【问题标题】：how to convert all <NotAvailable> to <NA> [duplicate]如何将所有 <NotAvailable> 转换为 <NA> [重复]
【发布时间】：2021-08-07 01:34:54
【问题描述】：

我有这个 df

PoolQC          Fence           MiscFeature
<chr>           <chr>           <chhr>
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> MnPrv           Shed        
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> Shed        
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>

如何将所有 NOT AVAILABLE 转换为 NA，以便在运行此代码时

df %>% 
  is.na() %>% 
  colSums() %>% 
  sort(decreasing = TRUE)

可以检测NA值

或者，我可以通过读取csv文件来转换它吗？

df = read.csv("C:/Users/x.csv", sep = ";")

【问题讨论】：

考虑再次检查我的答案，我已经更新它以解决您在read.csv 期间阅读 NA 字符串的问题。谢谢
这能回答你的问题吗？ Replacing character values with NA in a data frame

标签： r dplyr tidyr

【解决方案1】：

假设我有以下数据框：

df <- data.frame(foo=c("<NOT AVAILABLE>", 2), bar=c(3, "<NOT AVAILABLE>"))

将所有出现的<NOT AVAILABLE> 替换为NA：

df[df == "<NOT AVAILABLE>"] <- NA

然后：

对于第二个问题，您可以在read.csv 期间将特定字符串设置为解释为 NA。示例：

result = read.csv(file, na.strings = "<NOT AVAILABLE>")

【讨论】：