【问题标题】:Speed up date columns conversion (pandas) from string to datetime加快从字符串到日期时间的日期列转换(熊猫)
【发布时间】:2018-07-18 02:55:08
【问题描述】:

我正在使用 python 中的一个大型 .csv 文件,它的日期列是“str”。 我正在使用以下代码将此列中的记录转换为日期时间。

df[date_column].fillna('1900-01-01',inplace=True)
df[date_column] = df[date_column].apply(lambda x : pd.to_datetime(x, format = datetime_format))

但这似乎需要很长时间才能执行。欢迎任何有关如何处理此问题的建议。谢谢。

【问题讨论】:

    标签: python pandas datetime runtime date-parsing


    【解决方案1】:

    当你阅读你的 csv 时,你可以使用parse_dates

    df = pd.read_csv('yourcsv.csv',parse_dates = date_column)
    

    那就让我们用converters

    pd.read_csv('yourcsv.csv', converters={'date_column':lambda x : pd.to_datetime(x,errors = 'coerce')})
    

    【讨论】:

    • 我尝试了这种方法,但由于存在 NULLS,因此无法正常工作。
    • @Dtengu 你试试converters
    • 好建议,花费更少的时间。我还在这里发现了一些有趣的东西,它运行得更快:github.com/sanand0/benchmarks/tree/master/date-parse
    猜你喜欢
    • 2017-05-20
    • 2019-06-06
    • 2017-09-17
    • 1970-01-01
    • 2022-06-29
    • 2016-03-24
    • 2015-07-19
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多