multiprocessing模块
仔细说来,multiprocessing不是一个模块而是python中一个操作、管理进程的包。 之所以叫multi是取自multiple的多功能的意思,在这个包中几乎包含了和进程有关的所有子模块。由于提供的子模块非常多,为了方便大家归类记忆,我将这部分大致分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享。
multiprocessing.process模块
process模块介绍
process模块是一个创建进程的模块,借助这个模块,就可以完成进程的创建。
Process([group [, target [, name [, args [, kwargs]]]]]),由该类实例化得到的对象,表示一个子进程中的任务(尚未启动) 强调: 1. 需要使用关键字的方式来指定参数 2. args指定的为传给target函数的位置参数,是一个元组形式,必须有逗号 参数介绍: group参数未使用,值始终为None target表示调用对象,即子进程要执行的任务 args表示调用对象的位置参数元组,args=(1,2,\'egon\',) kwargs表示调用对象的字典,kwargs={\'name\':\'egon\',\'age\':18} name为子进程的名称
p.start():启动进程,并调用该子进程中的p.run()
p.run():进程启动时运行的方法,正是它去调用target指定的函数,我们自定义类的类中一定要实现该方法
p.terminate():强制终止进程p,不会进行任何清理操作,如果p创建了子进程,该子进程就成了僵尸进程,使用该方法需要特别小心这种情况。如果p还保存了一个锁那么也将不会被释放,进而导致死锁
p.is_alive():如果p仍然运行,返回True
p.join([timeout]):主线程等待p终止(强调:是主线程处于等的状态,而p是处于运行的状态)。timeout是可选的超时时间,需要强调的是,p.join只能join住start开启的进程,而不能join住run开启的进程
p.daemon:默认值为False,如果设为True,代表p为后台运行的守护进程,当p的父进程终止时,p也随之终止,并且设定为True后,p不能创建自己的新进程,必须在p.start()之前设置
p.name:进程的名称
p.pid:进程的pid
p.exitcode:进程在运行时为None、如果为–N,表示被信号N结束(了解即可)
p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。这个键的用途是为涉及网络连接的底层进程间通信提供安全性,这类连接只有在具有相同的身份验证键时才能成功(了解即可)
在Windows操作系统中由于没有fork(linux操作系统中创建进程的机制),在创建子进程的时候会自动 import 启动它的这个文件,而在 import 的时候又执行了整个文件。因此如果将process()直接写在文件中就会无限递归创建子进程报错。所以必须把创建子进程的部分使用if __name__ ==‘__main__’ 判断保护起来,import 的时候 ,就不会递归运行了。
创建进程
from multiprocessing import Process import time def func(): time.sleep(1) print("这是子进程") if __name__ ==\'__main__\' : p = Process(target=func) p.start() time.sleep(2) print(\'这是主进程\')
from multiprocessing import Process import time def func(name): print(\'子进程名字%s\'%name) time.sleep(5) print(\'这是子进程\') if __name__ == \'__main__\' : p = Process(target=func,args=(\'Peter\',)) p.start() time.sleep(2) p.join() # 代码执行到这里,主进程main会停止等待子进程执行完毕才继续 print(\'这是主进程\')
from multiprocessing import Process import os def func(): print(\'我是子进程,我的进程id是%s,我爸爸的id是%s\'%(os.getpid(),os.getppid())) if __name__ == \'__main__\': print(\'我是main爸爸,我的进程id是%s\' % os.getpid()) for i in range(5): p = Process(target = func,args=()) p.start()
from multiprocessing import Process import time def func(i): print(\'这里是第%s个子进程\'%(i)) time.sleep(1) if __name__ == \'__main__\': print(\'这里是main爸爸\') for i in range(5): p = Process(target = func,args=(i,)) p.start()
from multiprocessing import Process import time def func(i): print(\'这里是第%s个子进程\'%(i)) time.sleep(1) if __name__ == \'__main__\': for i in range(5): p = Process(target = func,args=(i,)) p.start() p.join()# main会停在这一句,等子进程执行完,再继续走,也就是才再走下一次for循环 print(\'这里是main爸爸\')
from multiprocessing import Process import time def func(i): print(\'第%s个子进程\'%i) time.sleep(1) if __name__ ==\'__main__\' : l = [] for i in range(5): p = Process(target = func,args=(i,)) p.start() l.append(p) [i.join() for i in l ] print(\'这是主进程\')
用继承方法开启多进程(继承process类)
from multiprocessing import Process import os class MyProcess(Process): def __init__(self,name): super().__init__() self.name =name def run(self): print(\'我是%s,我的id是%s\'%(self.name,os.getpid()) if __name__ == "__main__" : p1 = MyProcess(\'老李\') p2 = MyProcess(\'老张\') p3 = MyProcess(\'老王\') p1.start()# 调用start方法,start方法内自动调用run方法 p2.start() # p2.run() p3.start() p1.join() p2.join()# 注意,如果调用run方法,就不能再调用join方法 p3.join() print(\'我是main爸爸\')
from multiprocessing import Process def func(): global n n = 0 print(\'子进程内 n = %s\'%n) if __name__ == \'__main__\': n = 100 p = Process(target=func) p.start() print(\'主进程内 n = %s\'%n)
守护进程 daemon
会随着父进程的结束而结束。
父进程创建守护进程
其一:守护进程会在父进程代码执行结束后就终止
其二:守护进程内无法再开启子进程,否则抛出异常:AssertionError: daemonic processes are not allowed to have children
注意:进程之间是互相独立的,父进程代码运行结束,守护进程随即终止(是代码运行结束,而不是解释器读完代码,是要执行完,守护进程才终止)
from multiprocessing import import time def func(): print(\'子进程开始执行\') time.sleep(2) print(\'子进程结束执行\') if __name__ == \'__main__\': print(\'主进程开始执行\') p = Process(target=func1,) p.daemon = True #将p 设置为守护进程,此代码一定要在start之前设置。 p.start() time.sleep(1) print(\'主进程结束执行\')
from multiprocessing import Process import time def func2(): print(\'子进程2开始执行\') time.sleep(2) print(\'子进程2结束执行\') def func1(): print(\'子进程开始执行\') time.sleep(2) print(\'子进程结束执行\') if __name__ == \'__main__\': print(\'主进程开始执行\') p1 = Process(target=func1,) p2 = Process(target=func2) p1.daemon = True# 将p1 设置为守护进程,此代码一定要在start之前设置。 p1.start() p2.start() time.sleep(1)# 此时p1 p2 和main 都已经开始执行 print(\'主进程结束执行\')# 当主进程打印完这句话,代表主进程结束,守护进程p1肯定随之结束 # 但是p2 不是守护进程,不会结束,所以此时程序(也就是主进程)会等待p2结束之后才结束。
from multiprocessing import Process import random import time class MyProcess(Process): def __init__(self,name): super(MyProcess, self).__init__() self.name = name# name是父类Process中的属性,这里相当于给子进程命名 def run(self): print(\'%s 正在撩小姐姐\'%self.name) time.sleep(random.randint(1,3)) print(\'%s 还在撩小姐姐\'%self.name) if __name__ == \'__main__\': p = MyProcess(\'Alex\') p.start() time.sleep(0.1) p.terminate()# 将p进程杀死的命令。 将任务提交给操作系统,操作系统什么时候执行不受用户决定 print(p.is_alive())# 判断p进程是否还存在 time.sleep(1) print(p.is_alive())# 判断p进程是否还存在
from multiprocessing import Process import random import time class MyProcess(Process): def __init__(self,name): super(MyProcess, self).__init__() self.name = name# name是父类Process中的属性,这里相当于给子进程命名 def run(self): print(\'%s 正在撩小姐姐\'%self.name) time.sleep(random.randint(1,3)) print(\'%s 还在撩小姐姐\'%self.name) if __name__ == \'__main__\': p = MyProcess(\'Alex\') p.start() print(p.name,p.pid)# 打印进程名字,进程id号