【问题标题】:Convert factor to numeric while ignoring nas将因子转换为数字,同时忽略 nas
【发布时间】:2018-02-22 11:18:46
【问题描述】:

我有一个数据框,其中包含一些已分解的数字列,我需要将它们转换为数字。这是一个示例:

 y <- structure(list(y = structure(c(2L, NA, 3L, 1L, 4L, 2L), .Label = c(" 1,000,000.00   ",  " 1,200,000.00   ", " 150,000.00   ", " 200,000.00   "), class = "factor")), .Names = "y", row.names = c(NA, -6L), class = "data.frame")

数据框包含 nas,因此当我尝试将因子级别转换为数字时,我得到所有 nas 作为回报。这是我尝试过的。

y <- as.data.frame(y)
y <- as.numeric(levels(y))
y$y <- as.numeric(levels(y$y)[y$y])

这仅返回 NA。如何将这些因子水平转换为数字,同时保持 nas 为 na?

【问题讨论】:

  • 如果你想使用as.numeric,你需要先去掉所有的逗号,例如gsub.

标签: r type-conversion numeric na


【解决方案1】:

您只想保留数字,因此可以使用gsub 删除其他所有内容:

levels(y$y) <- gsub("[^0-9]", "", levels(y$y))
levels(y$y) <- as.numeric(levels(y$y))
#         y
# 1 1.2e+08
# 2    <NA>
# 3 1.5e+07
# 4   1e+08
# 5   2e+07
# 6 1.2e+08

【讨论】:

    【解决方案2】:

    您需要删除逗号

    as.numeric(gsub(",", "", levels(y$y)[y$y]))
    
    [1] 1200000      NA  150000 1000000  200000 1200000
    

    【讨论】:

      猜你喜欢
      • 2015-06-01
      • 1970-01-01
      • 1970-01-01
      • 2018-10-28
      • 1970-01-01
      • 2019-07-13
      • 2016-12-01
      • 2017-09-30
      • 1970-01-01
      相关资源
      最近更新 更多