【发布时间】:2021-05-30 10:30:42
【问题描述】:
我有一个包含列的 pandas 数据框:
['A'] 出发时间(以整数形式列出,例如:700 或 403,即 7:00 和 4:03);
['B'] 已用时间(以整数形式列出,例如:70 或 656,即 70 分钟和 656 分钟);
['C'] 到达时间(以整数形式列出:1810 和 355,即 18:10 和 03:55)。
我需要找到一种方法来开发一个具有布尔值的新列 ['D'],如果在第二天到达,则返回 True,如果在同一天到达,则返回 False。
我想访问 A 列的 -2 索引以将小时转换为分钟,然后添加剩余的分钟以标准化值,但不确定如何执行此操作,或者是否有更简单的方法可以找到它。这背后的想法是从一天开始的那一刻起获得总分钟数,如果超过一天的总分钟数,那么我会得到答案,但不确定这是否可行。
【问题讨论】:
-
101-> 10:10 还是 1:10? 24 小时制是否无处不在? -
请向我们提供数据集样本以帮助您
-
@ anon01 24h 被认为无处不在,是的 - 没有“上午”或“下午”信息。@Cadone 不确定如何添加数据集的样本,但我会尝试。为了什么值得,这是一个 .txt 文件,大约有 35 列。这些列 A、B 和 C 已更改为 int astype 以帮助我计算,但每列的行数相同,每列大约 100 万行。我 必须 创建一个新列,遍历每一行并返回 True 表示超过第二天的时间(A 表示出发时间,B 表示经过的时间,C 表示到达时间)但没有日期信息,只是时间。
标签: python pandas numpy time jupyter