前言
①系统启动一个新线程的成本是比较高的,因为它涉及与操作系统的交互。在这种情形下,使用线程池可以很好地提升性能,尤其是当程序中需要创建大量生存期很短暂的线程时,更应该考虑使用线程池。
②线程池在系统启动时即创建大量空闲的线程,程序只要将一个函数提交给线程池,线程池就会启动一个空闲的线程来执行它。当该函数执行结束后,该线程并不会死亡,而是再次返回到线程池中变成空闲状态,等待执行下一个函数。
③使用线程池可以有效地控制系统中并发线程的数量。当系统中包含有大量的并发线程时,会导致系统性能急剧下降,甚至导致 Python 解释器崩溃【并发执行的程序会大量占用内存和cpu】,而线程池的最大线程数参数可以控制系统中并发线程的数量不超过此数。
线程池的使用
①线程池的基类是 concurrent.futures 模块中的 Executor 类; Executor 提供了两个子类,即 ThreadPoolExecutor 类和 ProcessPoolExecutor 类;其中 ThreadPoolExecutor 类用于创建线程池;而 ProcessPoolExecutor 类用于创建进程池。
②如果使用线程池/进程池来管理并发编程,那么只要将相应的 task函数 提交给线程池/进程池,剩下的事情就由线程池/进程池来搞定。【线程池会启动一个空闲的线程来执行 task函数 】
③ Exectuor 类提供了如下常用方法:
- submit(fn, *args, **kwargs) :将 fn 函数提交给线程池。*args 代表传给 fn 函数的参数;*kwargs 代表以关键字参数的形式为 fn 函数传入参数。
- map(func, *iterables, timeout=None, chunksize=1) :该函数类似于全局函数 map(func, *iterables),只是该函数将会启动多个线程,以异步方式立即对 iterables 执行 map 处理。
- shutdown(wait=True) :关闭线程池。
④程序将 task 函数提交(submit)给线程池后,submit 方法会返回一个 Future对象 , Future类 主要用于获取线程任务函数的返回值。由于线程任务会在新线程中以异步方式执行,因此,线程执行的函数相当于一个“将来完成”的任务,所以 Python 使用 Future 来代表。
⑤ Future 提供了如下方法:
- cancel() :取消该 Future 代表的线程任务。如果该任务正在执行,不可取消,则该方法返回 False;否则,程序会取消该任务,并返回 True。
- cancelled() :返回 Future 代表的线程任务是否被成功取消。
- running() :如果该 Future 代表的线程任务正在执行、不可被取消,该方法返回 True。
- done() :如果该 Funture 代表的线程任务被成功取消或执行完成,则该方法返回 True。
- result(timeout=None) :获取该 Future 代表的线程任务最后返回的结果。如果 Future 代表的线程任务还未完成,该方法将会阻塞当前线程,其中 timeout 参数指定最多阻塞多少秒。
- exception(timeout=None) :获取该 Future 代表的线程任务所引发的异常。如果该任务成功完成,没有异常,则该方法返回 None。
- add_done_callback(fn) :为该 Future 代表的线程任务注册一个“回调函数”,当该任务成功完成时,程序会自动触发该 fn 函数。
⑥在用完一个线程池后,应该调用该线程池的 shutdown() 方法,该方法将启动线程池的关闭序列。调用 shutdown() 方法后的线程池不再接收新任务【不再接受程序分配的函数】,但会将以前所有的已提交任务执行完成【已在线程池中的线程任务】。当线程池中的所有任务都执行完成后,该线程池中的所有线程都会死亡。
⑦使用线程池来执行线程任务的步骤如下:
参考博客:Python线程池及其原理和使用(超级详细)
参考博客:Python 多线程和线程池
去期待陌生,去拥抱惊喜。