【发布时间】:2021-06-26 16:59:30
【问题描述】:
我正在使用 Crunchbase 数据集。我有一个成立于 1636 年的哈佛大学的条目。当我尝试将字符串转换为 DateTime 时,这个条目给了我一个错误。
OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 1636-09-08 00:00:00
我发现 pandas 支持 1677 年的时间戳
>>> pd.Timestamp.min
Timestamp('1677-09-21 00:12:43.145225')
我查看了一些解决方案,例如建议使用 errors='coerce' 但删除此条目/使其为空不是一种选择。
您能否提出解决此问题的方法?
【问题讨论】:
-
来自文档Timestamp limitations“由于 pandas 以纳秒分辨率表示时间戳,因此可以使用 64 位整数表示的时间跨度被限制为大约 584 年”
-
您要如何处理需要时间戳数据类型的数据? Representing out-of-bounds spans中有一些不错的选择
-
这很有帮助。