【发布时间】:2020-01-15 18:23:29
【问题描述】:
我正在计时我创建的函数并得到不一致的结果。由于我使用的是 time.time(),因此我习惯于报告时间的一些小变化,但我的时间数据似乎是双峰的,我不明白。
我的功能:
def sorteddups(listA,listB,key=None, equal=lambda x,y:x==y,greater=lambda x,y:x>y,mode=3):#mode: 0=AB, 1=Aonly, 2=Bonly, 3=[Aonly,Bonly,AB]
A=sorted(listA,key=key)
B=sorted(listB,key=key)
AB=[]
dupA=set()
dupB=set()
j=0
for i,a in enumerate(A):
try:
while greater(a,B[j]):j+=1
if equal(a,B[j]):
AB.append([a,B[j]])
dupA.add(i)
dupB.add(j)
except:pass
if mode==1 or mode==3:Aonly=[a for i,a in enumerate(A) if i not in dupA]
if mode==2 or mode==3:Bonly=[b for i,b in enumerate(B) if i not in dupB]
return AB if mode==0 else Aonly if mode==1 else Bonly if mode==2 else [Aonly,Bonly,AB]
我的结果:
>>> t=time()
>>> test3=sorteddups(test,test2)
>>> time()-t
0.836998701095581
>>> t=time()
>>> test3=sorteddups(test,test2)
>>> time()-t
1.2330021858215332
>>> t=time()
>>> test3=sorteddups(test,test2)
>>> time()-t
1.2690012454986572
>>> t=time()
>>> test3=sorteddups(test,test2)
>>> time()-t
0.8360021114349365
>>> t=time()
>>> test3=sorteddups(test,test2)
>>> time()-t
1.2589986324310303
>>> t=time()
>>> test3=sorteddups(test,test2)
>>> time()-t
0.8310055732727051
>>> t=time()
>>> test3=sorteddups(test,test2)
>>> time()-t
1.2420125007629395
知道什么会导致执行时间的这种双峰分布吗?
编辑:这里有一些你可以运行的测试代码:
import random
import string
from time import time
test=[[''.join(random.choice(string.ascii_lowercase) for i in range(150)),[random.randint(1,1000) for _ in range(4)],random.random()] for _ in range(200000)]
test2=test
for _ in range(10):
t=time()
test3=sorteddups(test,test2)
print(time()-t)
编辑: 我昨天在我的机器和我同事的机器上测试了这个。两者都产生明显的双峰结果。今天的结果对我们俩来说都是正常的。我唯一的猜测是系统范围的更新,但我的电脑没有重新启动。如果有人有一个理论,我很想知道是什么原因导致这在不同的机器上发生,然后第二天在两台机器上停止而不重新启动。将问题标记为已回答。
【问题讨论】:
标签: python performance time