【发布时间】:2012-10-08 14:53:21
【问题描述】:
在编码比赛中,我们会遇到如下输入:
2 3
4 5
所以我们执行以下操作:
m, n = [int(x) for x in raw_input().split(' ')]
有没有更快的方法来做同样的事情?
【问题讨论】:
-
“更快”是什么意思?执行时间还是更少的代码?
标签: python performance input
在编码比赛中,我们会遇到如下输入:
2 3
4 5
所以我们执行以下操作:
m, n = [int(x) for x in raw_input().split(' ')]
有没有更快的方法来做同样的事情?
【问题讨论】:
标签: python performance input
出于所有实际目的,这大约是您能获得的最快速度。在某些机器上,如果您使用 map 而不是列表解析,您可能会看到订单加速或几个百分点,但这不能保证。
这是我机器上的一些快速计时:
from itertools import imap
#map
>>> timeit.timeit('x,y = map(int,line.split(" "))','from __main__ import line')
4.7857139110565186
>>> timeit.timeit('x,y = map(int,line.split())','from __main__ import line')
4.5680718421936035
#list comprehension
>>> timeit.timeit('x,y = [int(x) for x in line.split(" ")]','from __main__ import line')
4.3816750049591064
>>> timeit.timeit('x,y = [int(x) for x in line.split()]','from __main__ import line')
4.3246541023254395
#itertools.imap
>>> timeit.timeit('x,y = imap(int,line.split(" "))','from __main__ import line,imap')
4.431504011154175
>>> timeit.timeit('x,y = imap(int,line.split())','from __main__ import line,imap')
4.3257410526275635
#generator expression
>>> timeit.timeit('x,y = (int(x) for x in line.split(" "))','from __main__ import line')
4.897794961929321
>>> timeit.timeit('x,y = (int(x) for x in line.split())','from __main__ import line')
4.732620000839233
令人惊讶的是,split() 似乎比 split(" ") 表现更好。
如果您保证使用 0 到 9 之间的数字的 ascii 输入,则可以使用 ord 做得更好:
>>>timeit.timeit('x,y = [ord(x)-48 for x in line.split(" ")]','from __main__ import line')
1.377655029296875
>>> timeit.timeit('x,y = [ord(x)-48 for x in line.split()]','from __main__ import line')
1.3243558406829834
但这对您的输入施加了严格的限制。
您可以尝试另一个想法(我不知道性能影响会是什么),但您可以从sys.stdin 阅读您的行:
import sys
for line in sys.stdin:
x,y = [ord(x)-48 for x in line.split()]
【讨论】:
split() 和 split(" ") 实际上并没有做同样的事情...docs.python.org/library/stdtypes.html#str.split
split() 和 split(None) 是一样的。然而,split() 比split(" ")更通用,这就是为什么我很惊讶它更快(它需要对"\t" 进行测试,而不仅仅是' ',或者运行' ' 而不是单个 ' ' 例如)
split() 可能在 C 中使用类似 strtok(str, " \t") 的东西来处理连续的分隔符......而 split(' ') 必须反对这种行为(也可能使用''s) 构建更大的结果列表
使用map(),与内置函数一起使用时比列表推导更快:
m, n = map(int, raw_input().split())
【讨论】: