ThreadPoolExecutor
python3标准库
concurrent.futures
中常用的线程池
ThreadPoolExecutor
特点:
- 主线程可以获取某一个线程的状态,以及返回值。
- 线程同步
- 让多线程和多进程的编码接口一致。
简单粗暴
上手操练
将使用ThreadPoolExecutor线程池,将文件读取出来,并在文件每一行行末追加内容
_我是吊车尾
第一步,假设有个文件,20000行,第一行数据为”1“,后续自增。(直接代码写一个)
from concurrent.futures import ThreadPoolExecutor
index=1
line_list=[]for i inrange(20000):
line_list.append(index)
index +=1withopen("./test1.txt","a")asfile:for line in line_list:file.write(str(line)+"\n")
第二步,将第一步中生成的文件读出来存储到list中,并用ThreadPoolExecutor多线程的在每一行的末尾追加内容“_我是吊车尾”
file_line_list =[]withopen("./test1.txt","r")asfile:for line infile:
file_line_list.append(line.strip('\n'))defexec_function(opera_list):print("追加", opera_list +"_我是吊车尾")return opera_list +"_我是吊车尾"from concurrent.futures import ThreadPoolExecutor
with ThreadPoolExecutor()as executor:# 使用with
res = executor.map(exec_function, file_line_list, timeout=5)print("追加完成!!!")withopen("./test2.txt","w")asfile:for line in res:file.write(line +"\n")
PS:建议使用
with ThreadPoolExecutor()
,如果使用
for ThreadPoolExecutor()
,在结束时,记得自己
executor.shutdown
,(with方法内部已经实现了
wait()
,在使用完毕之后可以自行关闭线程池,减少资源浪费。)
第三步,查看执行结果:
贴下ThreadPoolExecutor类init方法代码
classThreadPoolExecutor(_base.Executor):# Used to assign unique thread names when thread_name_prefix is not supplied.
_counter = itertools.count().__next__
def__init__(self, max_workers=None, thread_name_prefix=''):"""Initializes a new ThreadPoolExecutor instance.
Args:
max_workers: The maximum number of threads that can be used to
execute the given calls.
thread_name_prefix: An optional name prefix to give our threads.
"""if max_workers isNone:# Use this number because ThreadPoolExecutor is often# used to overlap I/O instead of CPU work.
max_workers =(os.cpu_count()or1)*5if max_workers <=0:raise ValueError("max_workers must be greater than 0")
self._max_workers = max_workers
self._work_queue = queue.Queue()
self._threads =set()
self._shutdown =False
self._shutdown_lock = threading.Lock()
self._thread_name_prefix =(thread_name_prefix or("ThreadPoolExecutor-%d"% self._counter()))
其他
本文只涉及了最基本的应用,
ThreadPoolExecutor
中其实还有更多的参数可以使用,大家有兴趣可以继续深入。
corePoolSize:核心线程池的线程数量
maximumPoolSize:最大的线程池线程数量
keepAliveTime:线程活动保持时间,线程池的工作线程空闲后,保持存活的时间。
unit:线程活动保持时间的单位。
workQueue:指定任务队列所使用的阻塞队列
版权归原作者 ZeKyll 所有, 如有侵权,请联系我们删除。