Python进程池使用_Pool并发处理

3次阅读

pool适用于cpu密集型任务，可绕过gil；适合输入可分割、无强依赖的独立子任务；不适用于i/o密集型或需频繁通信的场景。

python 的 Pool 是 multiprocessing 模块中用于简化多进程并发的工具，适合 CPU 密集型任务（如数值计算、图像处理、批量解析等），能有效利用多核 CPU 提升执行效率。

什么时候该用 Pool 而不是 threading 或 asyncio

Pool 适用于：

CPU 密集型任务（比如大量循环、科学计算、加密解密）——因为多进程可绕过 GIL 限制
输入数据量大、可拆分为独立子任务（例如处理 1000 个文件、对 1 万条记录做相同变换）
不需要进程间频繁通信或共享状态（Pool 默认是“无状态”的，每个子进程独立运行）

不推荐用 Pool 的场景：

I/O 密集型为主（如大量 http 请求、数据库读写）——此时 threading 或 asyncio 更轻量、更高效
任务之间依赖强、需实时同步或共享大量内存数据
单次任务耗时极短（启动进程开销可能反超收益）

基础用法：map、apply、apply_async

Pool 最常用的是 map 方法，它把函数并行应用到一个可迭代对象上，返回结果列表（顺序与输入一致）：

立即学习“Python免费学习笔记（深入）”；

  # 示例：对数字列表求平方
  from multiprocessing import Pool
  def square(x): return x * x
  with Pool(4) as p:
    result = p.map(square, [1, 2, 3, 4, 5])
  print(result) # [1, 4, 9, 16, 25]

其他常用方法：

apply(func, args)：同步调用，阻塞直到完成，适合单次任务
apply_async(func, args, callback=...)：异步提交，立即返回 AsyncResult 对象，支持回调函数
starmap(func, iterable_of_tuples)：类似 map，但自动解包每组参数（如 [(1,2), (3,4)] → func(1,2), func(3,4)）

控制并发数与资源管理

Pool(processes=n) 中的 n 表示最大并发进程数，默认为 os.cpu_count()。合理设置能避免过度创建进程拖慢系统：

纯 CPU 计算：设为 CPU 核心数（如 4 核就用 Pool(4)）
混合型任务（含少量 I/O）：可略高于核心数（如 Pool(6)），但不宜翻倍
内存受限环境：减少进程数，防止内存爆炸（每个子进程会拷贝父进程内存镜像）

务必使用 with Pool(...) as p: 语法，确保进程池正常关闭；若手动创建，记得调用 p.close() 和 p.join()。

传参与序列化注意事项

子进程无法访问父进程的变量、闭包或未导入模块，所有传入函数和参数必须满足 可被 pickle 序列化：

✅ 支持：内置类型（list/dict/int/str）、普通函数（定义在模块顶层）、functools.partial
❌ 不支持：Lambda 表达式、嵌套函数、类实例方法（除非用 functools.partial 绑定）、打开的文件句柄、数据库连接

常见绕过方式：

把逻辑封装成顶层函数，通过参数传入所需数据
用 initializer 和 initargs 在每个子进程启动时预加载资源（如初始化模型、读取配置）
对不可序列化的对象（如 numpy 数组），优先考虑 shared_memory（Python 3.8+）或 Manager，但会增加复杂度

发表于：数据库

近两天内

复制链接

PythonExcel自动化进阶教程_公式宏与批量处理技巧

mysql如何优化group by性能_mysql group by性能优化

mysql查询缓存是否值得开启_mysql查询缓存使用分析

如何在 Go 中同时监听发送与接收通道并实现非阻塞选择

LinuxShell自动巡检脚本_巡检方案实现

Python进程池使用_Pool并发处理

什么时候该用 Pool 而不是 threading 或 asyncio

基础用法：map、apply、apply_async

控制并发数与资源管理

传参与序列化注意事项

MySQL 主从复制面试核心知识

Python init与new区别_对象创建流程

如何从欧洲议会官网批量抓取议员信息并结构化存储

Sublime Text怎么设置自动补全延迟_Sublime性能优化配置【进阶】

html多标签设置技巧_html怎么设置多个li标签【方法】

mysql执行SQL时如何进行锁定行数据_mysql行锁与事务

html文件怎么编辑_网页源码修改方法速通【教程】

mac使用vscode怎么打开编译器终端

PHP 中检测 $_POST 数组是否包含空值或未设置字段的正确方法

mysql如何优化内存中临时表排序_mysql max_length_for_sort_data