【发布时间】:2016-10-07 21:01:45
【问题描述】:
我一直在用
pd.read_csv('file.csv',parse_dates=['date_time'])
解析日期,然后运行 DateTimeIndex 从 date_time 变量中读取年、月、日。正确完成后,'date_time' 应格式化为 datetime64。但是数据列中有一些东西,我一直将“对象”作为变量格式,所以当 DateTimeIndex 它时我收到 ValueError 。我的数据太大了,我无法找出到底发生了什么。我应该如何处理这个问题,以便我可以将异常更改为丢失并解析 data_time 变量?谢谢。
更新:
我按照 Edchum 的建议做了,除了手动操作。这是我的猜测为什么数据不正确:一个日期应该是 2016,而不是显示 2161。有谁知道为什么在这种情况下 python 不会解析日期时间?如何识别所有与此相似的行并全部删除?
【问题讨论】:
-
添加示例数据,以防它有什么独特之处。检查 parse_dates 的语法。
-
我尝试了线程中建议的方法,但出现以下错误:
-
OutOfBoundsDatetime:越界纳秒时间戳:1-255-255 00:00:00
-
您可以使用二分查找的方式来查找有问题的记录(取1st/2nd一半,看哪个有问题,然后再拆分)。
-
对python比较陌生,二进制方法是什么?