0


python—多进程之进程池

一、进程池

1、进程池定义:

进程池:可以提供指定数量的进程给用户使用,即当有新的请求提交到进程池中时,如果池未满,则会创建一个新的进程用来执行该请求;反之,如果池中的进程数已经达到规定最大值,那么该请求就会等待,只要池中有进程空闲下来,该请求就能得到执行。
2、原理图
绿色:子进程没有工作,处于空闲状态(子进程没有调用任务函数)
粉色:子进程处于工作状态(子进程调用了任务函数)
在这里插入图片描述
在这里插入图片描述
3、使用进程池的优点
1.提高效率,节省开辟进程和开辟内存空间的时间及销毁进程的时间
2.节省内存空间
4、Pool中的函数说明:
在这里插入图片描述
执行结果:
在这里插入图片描述
Pool(4):创建多个进程,表示可以同时执行的进程数量为4个。默认大小是CPU的核心数果。
join():进程池对象调用join,会等待进程池中所有的子进程结束完毕再去结束父进程。
close():如果我们用的是进程池,在调用join()之前必须要先调用close(),并且在close()之后不能再继续往进程池请求
5、同步执行和异步执行
pool.apply_async(func,args,kwds):异步执行;将事件放入到进程池队列。args以元组的方式传参,kwds以字典的方式传参。
pool.apply_sync(func,args,kwds):同步执行;将事件放入到进程池队列。

同步,就是调用某个东西时,调用方得等待这个调用返回结果才能继续往后执行。
异步,和同步相反调用方不会等待得到结果,而是在调用发出后调用者可用继续执行后续操作,被调用者通过状体来通知调用者,或者通过回掉函数来处理这个调用

注意:
因为我们Pool(4)指定了同时最多只能执行4个进程(Pool进程池默认大小是CPu的核心数),但是我们多放入了6个进程进入我们的进程池,所以程序一开始就会只开启4个进程。
而且子进程执行是没有顺序的,先执行哪个子进程操作系统说了算的。而且进程的创建和销毁也是非常消耗资源的,所以如果进行一些本来就不需要多少耗时的任务你会发现多进程甚至比单进程还要慢

标签: python 爬虫

本文转载自: https://blog.csdn.net/YZL40514131/article/details/120689274
版权归原作者 敲代码敲到头发茂密 所有, 如有侵权,请联系我们删除。

“python—多进程之进程池”的评论:

还没有评论