Python asyncio 协程调度的内部机制

6次阅读

事件循环通过_ready队列调度Task,协程需显式创建Task或await才执行;asyncio.sleep(0)注册回调实现让权;I/O与定时器由selector和最小协同处理。

Python asyncio 协程调度的内部机制

asyncio 事件循环怎么拿到待执行的协程

协程对象本身不会自动运行,必须被显式调度进事件循环。当你调用 asyncio.create_task()loop.create_task(),实际是把协程对象包装成 Task 实例,并调用 task._schedule_callbacks() 把它塞进事件循环的就绪队列(loop._ready,类型为 collections.deque)。直接 await coro 则由当前正在运行的 Task 自行驱动子协程,不经过就绪队列。

常见误区:以为 async def 函数一定义就入队 —— 实际上只是生成协程对象,和 Lambda 类似,不调用就不触发。

  • asyncio.run(main()) 内部会新建事件循环、调用 loop.run_until_complete(main()),再启动调度
  • 手动获取当前循环用 asyncio.get_running_loop();跨线程必须用 asyncio.get_event_loop_policy().get_event_loop()
  • 如果在非协程函数里误调 await,会报 RuntimeError: await outside async function

Task 状态切换和 yield 控制点在哪

每个 Task 是一个特殊的 Future 子类,内部持有一个协程对象和状态机(_state 字段)。它只在明确的挂起点让出控制权:即遇到 await 表达式且右侧是一个“可等待对象”(Awaitable),比如另一个协程、asyncio.sleep()asyncio.Lock 或底层 Future

关键点在于:不是所有 await 都导致切换;如果被 await 的对象已就绪(如已完成的 Future),则立即返回结果,不交还控制权给事件循环。

立即学习Python免费学习笔记(深入)”;

  • 挂起时,Task 把自身从运行中移除,注册回调到被 await 的对象上(如 future.add_done_callback()
  • 恢复时,事件循环从 loop._ready 取出 Task 并调用其 _step() 方法继续执行协程帧
  • asyncio.current_task() 返回当前正在运行的 Task 对象,可用于调试或上下文追踪

为什么 asyncio.sleep(0) 能让出执行权

asyncio.sleep(0) 创建一个将在“下一个事件循环迭代”完成的 Future,它内部调用 loop.call_soon() 注册回调,因此当前 Task 必然在本次迭代结束前被暂停,并在下一轮从 loop._ready 中重新取出执行。

这常被用作协作式让权(cooperative yielding),类似其他语言的 yield,但要注意:它不保证其他 Task 立即运行 —— 如果 loop._ready 为空,事件循环可能直接进入 I/O 等待,直到有新事件唤醒。

  • 不要用 asyncio.sleep(0) 模拟忙等待,它无法替代 time.sleep()
  • 真正需要强制切出时,更推荐 await asyncio.yield_()python 3.12+)
  • 在 CPU 密集型协程中,仅靠 sleep(0) 不足以避免阻塞,仍需配合 loop.run_in_executor()

事件循环如何处理 I/O 和定时器

CPython 默认使用 selectors 模块实现多路复用(linux 上是 epollmacOS 是 kqueue),事件循环在每次迭代开始前调用 selector.select(timeout) 等待就绪的文件描述符。同时维护一个最小堆(heapq)管理定时器(loop._scheduled),每次迭代检查堆顶是否到期。

调度顺序是:先运行 loop._ready 中所有就绪 Task;再处理已到期的定时器(如 call_later);最后做一次 I/O 等待。这个三阶段循环构成一次完整的事件循环迭代。

  • 如果你看到协程响应延迟,优先检查是否有长期未返回的同步代码阻塞了整个循环
  • loop.set_debug(True) 会启用慢回调检测(如单次回调 > 100ms),并记录 Task 生命周期
  • 自定义事件循环策略(如 uvloop)替换默认实现时,必须确保其 create_future()create_task() 行为兼容 asyncio 协议

协程调度不是魔法,它依赖精确的状态跟踪与回调注册;最易忽略的是:Task 的生命周期完全由事件循环管理,一旦创建就必须被循环驱动,否则协程对象会泄漏且永不执行。调试时优先看 asyncio.all_tasks()task.get_coro(),而不是只盯着 await 语句本身。

text=ZqhQzanResources