一、迭代器
1 可迭代协议
- 迭代:就是类似for循环,将某个数据集内的数据可以“一个挨着一个取出来”
- 可迭代协议:
① 协议内容:内部实现__iter__方法
② 验证方法:dir()方法。通过dir()方法查看是否含有__iter__方法
③ __iter__方法的作用:可迭代的数据类型执行__iter__方法后会生成一个迭代器对象
print([1,2].__iter__()) 结果 <list_iterator object at 0x1024784a8>
2 迭代器协议
1 引出
''' dir([1,2].__iter__())是列表迭代器中实现的所有方法,dir([1,2])是列表中实现的所有方法,都是以列表的形式返回给我们的,为了看的更清楚,我们分别把他们转换成集合, 然后取差集。 '''
#实现的所有方法 print(dir([1,2].__iter__())) print(dir([1,2]))
#取差集 print(set(dir([1,2].__iter__()))-set(dir([1,2]))) 结果: {'__length_hint__', '__next__', '__setstate__'}
我们看到在列表迭代器中多了三个方法,那么这三个方法都分别做了什么事呢?
iter_l = [1,2,3,4,5,6].__iter__()
#获取迭代器中元素的长度
print(iter_l.__length_hint__())
#根据索引值指定从哪里开始迭代
print('*',iter_l.__setstate__(4))
#一个一个的取值
print('**',iter_l.__next__())
print('***',iter_l.__next__())
在这三个方法中,能让我们一个一个取值的神奇方法是谁???答案就是__next__
在for循环中,就是在内部调用了__next__方法才能取到一个一个的值。那接下来我们就用迭代器的 next方法来写一个不依赖for的遍历。
l = [1,2,3,4] l_iter = l.__iter__() item = l_iter.__next__() print(item) item = l_iter.__next__() print(item) item = l_iter.__next__() print(item) item = l_iter.__next__() print(item) item = l_iter.__next__() print(item)
这是一段会报错的代码,如果我们一直取next取到迭代器里已经没有元素了,就会抛出一个异常 StopIteration,告诉我们,列表中已经没有有效的元素了。这个时候,我们就要使用异常处理机制来把这个异常处理掉。
l = [1,2,3,4]
l_iter = l.__iter__()
while True:
try:
item = l_iter.__next__()
print(item)
except StopIteration:
break
迭代器遵循迭代器协议:必须拥有__iter__方法和__next__方法。
注意: range()
print('__next__' in dir(range(12))) #查看'__next__'是不是在range()方法执行之后内部是否有__next__
print('__iter__' in dir(range(12))) #查看'__next__'是不是在range()方法执行之后内部是否有__next__
from collections import Iterator
print(isinstance(range(100000000),Iterator)) #验证range执行之后得到的结果不是一个迭代器
range()是一个可迭代的,不是一个迭代器
二、生成器
我们知道的迭代器有两种:一种是调用方法直接返回的,一种是可迭代对象通过执行iter方法得到的,迭代器有的好处是可以节省内存。
如果在某些情况下,我们也需要节省内存,就只能自己写。我们自己写的这个能实现迭代器功能的东西就叫生成器。
1.初识生成器
Python中提供的生成器:
- 生成器函数:常规的函数定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次从他离开的地方继续执行。
- 生成器表达式:类似于列表推导,但是,生成器返回按需生产结果的一个对象,而不是一次构建一个结果列表
生成器的本质:
本质:迭代器(就是自带了__iter__方法和__next__方法,不需要我们去实现)
特点:惰性运算,开发者自定义
2.生成器函数
一个含有yield关键字的函数就是一个生成器函数。yield可以为我们从函数中返回值,但是yield又不同于return,return的执行意味着程序的结束,调用生成器函数不会得到返回的具体的值,而是得到一个可迭代的对象。每一次获取这个可迭代对象的值,就能推动函数的执行,获取新的返回值。直到函数执行结束。
import time def genrator_fun1(): a = 1 print('现在定义了a变量') yield a b = 2 print('现在又定义了b变量') yield b g1 = genrator_fun1() print('g1 : ',g1) #打印g1可以发现g1就是一个生成器 print('-'*20) #我是华丽的分割线 print(next(g1)) time.sleep(1) #sleep一秒看清执行过程 print(next(g1))