【问题标题】:how to convert all <NotAvailable> to <NA> [duplicate]如何将所有 <NotAvailable> 转换为 <NA> [重复]
【发布时间】:2021-08-07 01:34:54
【问题描述】:

我有这个 df

PoolQC          Fence           MiscFeature
<chr>           <chr>           <chhr>
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> MnPrv           Shed        
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> Shed        
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>     
<NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE>

如何将所有 NOT AVAILABLE 转换为 NA,以便在运行此代码时

df %>% 
  is.na() %>% 
  colSums() %>% 
  sort(decreasing = TRUE)

可以检测NA值

或者,我可以通过读取csv文件来转换它吗?

df = read.csv("C:/Users/x.csv", sep = ";")

【问题讨论】:

标签: r dplyr tidyr


【解决方案1】:

假设我有以下数据框:

df <- data.frame(foo=c("<NOT AVAILABLE>", 2), bar=c(3, "<NOT AVAILABLE>"))

将所有出现的&lt;NOT AVAILABLE&gt; 替换为NA

df[df == "<NOT AVAILABLE>"] <- NA

然后:

对于第二个问题,您可以在read.csv 期间将特定字符串设置为解释为 NA。示例:

result = read.csv(file, na.strings = "<NOT AVAILABLE>")

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-02-28
    • 1970-01-01
    • 1970-01-01
    • 2019-06-10
    • 2022-01-24
    • 1970-01-01
    • 2021-08-10
    • 2012-06-17
    相关资源
    最近更新 更多