in 针对生成器表达式将使用__iter__() 方法并迭代表达式直到找到匹配项,使其在一般情况下比列表推导更有效,后者在扫描匹配结果之前首先生成整个列表。
您的具体示例的替代方法是使用any(),以使测试更加明确。我觉得这更具可读性:
any(x[0] == 3 for x in l)
您必须考虑到in 确实转发了生成器;如果您还需要在其他地方使用生成器,则不能使用此方法。
至于你的具体时间测试;您的“简短”测试存在致命缺陷。 izip() 生成器的第一次迭代将完全耗尽,使其他 9999 次迭代针对 empty 生成器进行测试。您正在测试在那里创建一个空列表和一个空生成器之间的区别,从而放大了创建成本的差异。
此外,您应该使用timeit module 运行测试,确保测试可重复。这意味着您也必须在每次迭代时创建一个新的 izip() 对象;现在对比度要大得多:
>>> # Python 2, 'short'
...
>>> timeit.timeit("l = izip(xrange(10**2), xrange(10**2)); 3 not in (x[0] for x in l)", 'from itertools import izip', number=100000)
0.27606701850891113
>>> timeit.timeit("l = izip(xrange(10**2), xrange(10**2)); 3 not in [x[0] for x in l]", 'from itertools import izip', number=100000)
1.7422130107879639
>>> # Python 2, 'long'
...
>>> timeit.timeit("l = izip(xrange(10**3), xrange(10**3)); 3 not in (x[0] for x in l)", 'from itertools import izip', number=100000)
0.3002200126647949
>>> timeit.timeit("l = izip(xrange(10**3), xrange(10**3)); 3 not in [x[0] for x in l]", 'from itertools import izip', number=100000)
15.624258995056152
在 Python 3 上:
>>> # Python 3, 'short'
...
>>> timeit.timeit("l = zip(range(10**2), range(10**2)); 3 not in (x[0] for x in l)", number=100000)
0.2624585109297186
>>> timeit.timeit("l = zip(range(10**2), range(10**2)); 3 not in [x[0] for x in l]", number=100000)
1.5555254180217162
>>> # Python 3, 'long'
...
>>> timeit.timeit("l = zip(range(10**3), range(10**3)); 3 not in (x[0] for x in l)", number=100000)
0.27222433499991894
>>> timeit.timeit("l = zip(range(10**3), range(10**3)); 3 not in [x[0] for x in l]", number=100000)
15.76974998600781
在所有情况下,生成器变体都快得多;您必须将“短”版本缩短为仅 8 个元组,列表理解才能开始获胜:
>>> timeit.timeit("n = 8; l = izip(xrange(n), xrange(n)); 3 not in (x[0] for x in l)", 'from itertools import izip', number=100000)
0.2870941162109375
>>> timeit.timeit("n = 8; l = izip(xrange(n), xrange(n)); 3 not in [x[0] for x in l]", 'from itertools import izip', number=100000)
0.28503894805908203
在 Python 3 上,生成器表达式和列表推导的实现更加接近,在列表推导获胜之前,您必须减少到 4 项:
>>> timeit.timeit("n = 4; l = zip(range(n), range(8)); 3 not in (x[0] for x in l)", number=100000)
0.284480107948184
>>> timeit.timeit("n = 4; l = zip(range(n), range(8)); 3 not in [x[0] for x in l]", number=100000)
0.23570425796788186