【发布时间】:2019-06-20 10:53:35
【问题描述】:
我需要转换以下DataFrame
julia> df = DataFrame(:A=>["", "2", "3"], :B=>[1.1, 2.2, 3.3])
看起来像
3×2 DataFrame
│ Row │ A │ B │
│ │ String │ Float64 │
├─────┼────────┼─────────┤
│ 1 │ │ 1.1 │
│ 2 │ 2 │ 2.2 │
│ 3 │ 3 │ 3.3 │
我想将 A 列从 Array{String,1} 转换为包含缺失值的 Int 数组。
我试过了
julia> df.A = tryparse.(Int, df.A)
3-element Array{Union{Nothing, Int64},1}:
nothing
2
3
julia> df
3×2 DataFrame
│ Row │ A │ B │
│ │ Union… │ Float64 │
├─────┼────────┼─────────┤
│ 1 │ │ 1.1 │
│ 2 │ 2 │ 2.2 │
│ 3 │ 3 │ 3.3 │
julia> eltype(df.A)
Union{Nothing, Int64}
但我得到一个包含Union{Nothing, Int64} 类型元素的列。
nothing(Nothing 类型)和missing(Missing 类型)似乎是两种不同的值。
所以我想知道如何使用 missing 值代替 A 列?
我也想知道missing 和nothing 是否会导致不同的性能。
【问题讨论】:
标签: dataframe julia missing-data