【问题标题】:Converting DataFrame String column containing missing values to Date in Julia在 Julia 中将包含缺失值的 DataFrame String 列转换为 Date
【发布时间】:2019-10-26 16:52:55
【问题描述】:

我正在尝试在 Julia 中将 DataFrame String 列转换为 Date 格式,但如果该列包含缺失值,则会产生错误:

ERROR: MethodError: no method matching Int64(::Missing)

我尝试运行的代码(适用于没有丢失数据的列)是:

df_pp[:tod] = Date.(df_pp[:tod], DateFormat("d/m/y"));

我尝试过的其他代码行是:

df_pp[:tod] = Date.(passmissing(df_pp[:tod]), DateFormat("d/m/y"));
df_pp[.!ismissing.(df_pp[:tod]), :tod] = Date.(df_pp[:tod], DateFormat("d/m/y"));

代码与名为df_pp 的数据框中的一个名为tod 的列相关。在尝试此操作之前,DataFramesDates 包都已加载。

【问题讨论】:

    标签: date dataframe julia missing-data


    【解决方案1】:

    passmissing 方式是

    df_pp.tod = passmissing(x->Date(x, DateFormat("d/m/y"))).(df_pp.tod)
    

    这里发生的情况是这样的:passmissing 接受一个函数,并返回一个处理 missings 的新函数(通过返回 missing)。在括号内的x->Date(x, DateFormat("d/m/y")) 中,我定义了一个新的匿名函数,它使用适当的DateFormat 调用Date 函数。 最后,我在df_pp.tod 上立即使用passmissing 返回的函数,使用. 沿列进行广播。 如果我将其拆分,则更容易看到语法:

    myDate(x) = Date(x, DateFormat("d/m/y"))
    Date_accepting_missing = passmissing(myDate)
    df_pp[:tod] = Date_accepting_missing.(df_pp[:tod])
    

    【讨论】:

    • 非常感谢。将其重写为:df_pp[:tod] = passmissing(x->Date(x, DateFormat("d/m/y"))).(df_pp[:tod]); 以保持一致性,但它有效!希望很快我能更好地理解语法。
    • 我已经添加了一些解释 - 这是否更清楚?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-01-08
    • 2017-06-09
    • 2021-06-05
    • 2019-11-30
    • 2019-02-11
    • 2018-06-25
    相关资源
    最近更新 更多