【发布时间】:2020-04-14 20:16:13
【问题描述】:
如何通过正则表达式检查 pandas 数据框中的日期值并选择错误的日期类型值?
日期:df
Date_col
22-01-2016
2016-01-22
2016/01/22
2018-12-25 09:27:53
22-Jan-2016
abcd
1203
2072006
20030201
输出:
Bad_Date
22-Jan-2016
abcd
1203
2072006
20030201
可能是只允许数字的正则表达式,'-' ,'/', ':' 可以解决这个问题。
【问题讨论】:
-
您是要验证列是否只是具有特定的类似日期的格式,还是要验证正确的日期?
-
例如,
2019-02-30是不是一个糟糕的约会?2018-45-12呢? -
你会考虑闰年吗?
-
你在乎10548年吗?比如
10548-01-01? -
它应该包含正确的日期格式 22-07-2019 或 2019-07-22 否则它将是一个错误的日期。
标签: python regex python-3.x pandas python-2.7