select
select最早于1983年出现在4.2BSD中,它通过一个select()系统调用来监视多个文件描述符的数组,当select()返回后,该数组中就绪的文件描述符便会被内核修改标志位,使得进程可以获得这些文件描述符从而进行后续的读写操作。
select目前几乎在所有的平台上支持,其良好跨平台支持也是它的一个优点,事实上从现在看来,这也是它所剩不多的优点之一。
select的一个缺点在于单个进程能够监视的文件描述符的数量存在最大限制,在Linux上一般为1024,不过可以通过修改宏定义甚至重新编译内核的方式提升这一限制。
另外,select()所维护的存储大量文件描述符的数据结构,随着文件描述符数量的增大,其复制的开销也线性增长。同时,由于网络响应时间的延迟使得大量TCP连接处于非活跃状态,但调用select()会对所有socket进行一次线性扫描,所以这也浪费了一定的开销。
poll
poll在1986年诞生于System V Release 3,它和select在本质上没有多大差别,但是poll没有最大文件描述符数量的限制。
poll和select同样存在一个缺点就是,包含大量文件描述符的数组被整体复制于用户态和内核的地址空间之间,而不论这些文件描述符是否就绪,它的开销随着文件描述符数量的增加而线性增大。
另外,select()和poll()将就绪的文件描述符告诉进程后,如果进程没有对其进行IO操作,那么下次调用select()和poll()的时候将再次报告这些文件描述符,所以它们一般不会丢失就绪的消息,这种方式称为水平触发(Level Triggered)。
epoll
直到Linux2.6才出现了由内核直接支持的实现方法,那就是epoll,它几乎具备了之前所说的一切优点,被公认为Linux2.6下性能最好的多路I/O就绪通知方法。
epoll可以同时支持水平触发和边缘触发(Edge Triggered,只告诉进程哪些文件描述符刚刚变为就绪状态,它只说一遍,如果我们没有采取行动,那么它将不会再次告知,这种方式称为边缘触发),理论上边缘触发的性能要更高一些,但是代码实现相当复杂。
epoll同样只告知那些就绪的文件描述符,而且当我们调用epoll_wait()获得就绪文件描述符时,返回的不是实际的描述符,而是一个代表就绪描述符数量的值,你只需要去epoll指定的一个数组中依次取得相应数量的文件描述符即可,这里也使用了内存映射(mmap)技术,这样便彻底省掉了这些文件描述符在系统调用时复制的开销。
另一个本质的改进在于epoll采用基于事件的就绪通知方式。在select/poll中,进程只有在调用一定的方法后,内核才对所有监视的文件描述符进行扫描,而epoll事先通过epoll_ctl()来注册一个文件描述符,一旦基于某个文件描述符就绪时,内核会采用类似callback的回调机制,迅速激活这个文件描述符,当进程调用epoll_wait()时便得到通知。
有许多封装好的异步非阻塞IO多路复用框架,底层在linux基于最新的epoll实现,为了更好的使用,了解其底层原理还是有必要的。
下面记录下分别基于Select/Poll/Epoll的echo server实现。
Python Select Server,可监控事件数量有限制:
1 #!/usr/bin/python 2 # -*- coding: utf-8 -*- 3 import select 4 import socket 5 import Queue 6 7 server = socket.socket(socket.AF_INET,socket.SOCK_STREAM) 8 server.setblocking(False) 9 server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR , 1) 10 server_address= ('192.168.1.5',8080) 11 server.bind(server_address) 12 server.listen(10) 13 14 #select轮询等待读socket集合 15 inputs = [server] 16 #select轮询等待写socket集合 17 outputs = [] 18 message_queues = {} 19 #select超时时间 20 timeout = 20 21 22 while True: 23 print "等待活动连接......" 24 readable , writable , exceptional = select.select(inputs, outputs, inputs, timeout) 25 26 if not (readable or writable or exceptional) : 27 print "select超时无活动连接,重新select...... " 28 continue; 29 #循环可读事件 30 for s in readable : 31 #如果是server监听的socket 32 if s is server: 33 #同意连接 34 connection, client_address = s.accept() 35 print "新连接: ", client_address 36 connection.setblocking(0) 37 #将连接加入到select可读事件队列 38 inputs.append(connection) 39 #新建连接为key的字典,写回读取到的消息 40 message_queues[connection] = Queue.Queue() 41 else: 42 #不是本机监听就是客户端发来的消息 43 data = s.recv(1024) 44 if data : 45 print "收到数据:" , data , "客户端:",s.getpeername() 46 message_queues[s].put(data) 47 if s not in outputs: 48 #将读取到的socket加入到可写事件队列 49 outputs.append(s) 50 else: 51 #空白消息,关闭连接 52 print "关闭连接:", client_address 53 if s in outputs : 54 outputs.remove(s) 55 inputs.remove(s) 56 s.close() 57 del message_queues[s] 58 for s in writable: 59 try: 60 msg = message_queues[s].get_nowait() 61 except Queue.Empty: 62 print "连接:" , s.getpeername() , '消息队列为空' 63 outputs.remove(s) 64 else: 65 print "发送数据:" , msg , "到", s.getpeername() 66 s.send(msg) 67 68 for s in exceptional: 69 print "异常连接:", s.getpeername() 70 inputs.remove(s) 71 if s in outputs: 72 outputs.remove(s) 73 s.close() 74 del message_queues[s]