【发布时间】:2023-03-30 10:05:02
【问题描述】:
我正在使用 python 和多个库(如 pandas 和 scipy)来准备数据,以便开始更深入的分析。例如,出于准备目的,我创建了两个日期不同的新列。
我的代码提供了预期的结果,但速度很慢,所以我不能将它用于具有 80K 行的表。运行时间大约需要。 80分钟的桌子就为了这个简单的操作。
这个问题肯定和我的写作操作有关:
tableContent[6]['p_test_Duration'].iloc[x] = difference
此外,python 提供了一个警告:
日期差的完整代码示例:
import time
from datetime import date, datetime
tableContent[6]['p_test_Duration'] = 0
#for x in range (0,len(tableContent[6]['p_test_Duration'])):
for x in range (0,1000):
p_test_ZEIT_ANFANG = datetime.strptime(tableContent[6]['p_test_ZEIT_ANFANG'].iloc[x], '%Y-%m-%d %H:%M:%S')
p_test_ZEIT_ENDE = datetime.strptime(tableContent[6]['p_test_ZEIT_ENDE'].iloc[x], '%Y-%m-%d %H:%M:%S')
difference = p_test_ZEIT_ENDE - p_test_ZEIT_ANFANG
tableContent[6]['p_test_Duration'].iloc[x] = difference
正确的结果表:
【问题讨论】:
-
如果你使用 pandas,为什么不使用 pandas datetime 呢?如果您可以添加示例输入,那么帮助会更容易
标签: python python-3.x pandas chained-assignment