【发布时间】:2021-12-24 18:24:30
【问题描述】:
我有一个数据框,其中有一列包含以多种格式显示的日期值(在 Excel 中显示为自定义/常规/日期),就像您在下面的“之前”列中看到的那样:
它们最初都是日期值,但在我得到的输入 CSV 文件中的某个地方被修改为不同的格式。
我的目标是将值转换为您可以在“之后”列中看到的“DD/MM/YYYY”格式。
我将其作为 Pandas/Spark 数据框阅读,因为在必须对其进行更改的列中有数千个这样的值。
我尝试执行以下操作,但没有生成我需要的正确“DD/MM/YYYY”格式。此外,一些值也保持不变:
df['After'] = pd.to_datetime(df['Before'], format='%d-%m-%y, errors='coerce')
任何人都可以帮忙解决这个问题吗?
干杯!
【问题讨论】:
标签: python pandas dataframe pyspark apache-spark-sql