Python import 语句背后发生了什么?

11次阅读

python导入模块时先按sys.path搜索文件,找到后加载并缓存于sys.modules,后续导入直接复用;import语句将模块对象绑定到当前命名空间,from导入则创建独立引用;包通过__init__.py识别,支持相对导入但需满足执行上下文。

Python import 语句背后发生了什么?

当你写 import math,Python 并不只是“找一个叫 math 的东西拿来用”。它实际启动了一套严谨的查找、加载和绑定流程,涉及路径搜索、模块缓存、命名空间管理和执行逻辑。理解这个过程,能帮你解决导入失败、循环引用、重载失效等常见问题

模块搜索:从 sys.path 开始找文件

Python 不会凭空知道模块在哪。它按顺序检查 sys.path 中的每个目录(包括当前目录、标准库路径、site-packages 等),寻找匹配的文件:

  • 先查 math.py(纯 Python 模块)
  • 再查 math.somath.pyd(C 扩展模块)
  • 最后查 math/__init__.py(包结构)

如果所有路径都找不到,就抛出 ModuleNotFoundError。你可以通过修改 sys.path 来临时添加自定义路径,但更推荐用 pip install -e . 或设置 PYTHONPATH 环境变量

模块加载与缓存:import 只执行一次

模块对象一旦成功加载,就会被存入 sys.modules 字典,键为模块名(如 "math"),值为已初始化的模块对象。

立即学习Python免费学习笔记(深入)”;

  • 第二次 import math 时,Python 直接从 sys.modules 返回已有对象,不再重新读取或执行文件
  • 这也意味着模块顶层代码(如 print、函数定义、变量赋值)只运行一次
  • 若需强制重载,可用 importlib.reload(module),但要注意它不更新已存在的引用

名称绑定:import 后发生了什么

import 语句本质是把模块对象绑定到当前命名空间的一个名字上:

  • import math → 在当前作用域创建名字 math,指向 sys.modules["math"]
  • from math import sqrt → 从模块对象中取出 sqrt,绑定到当前作用域sqrt
  • from math import * → 触发模块的 __all__(若定义),否则导入所有非私有名称(不推荐)

注意:from module import x 创建的是对 x 的新引用,不是对模块属性的“链接”。如果后续模块内 x 被重新赋值,已导入的 x 不会自动更新。

包导入:__init__.py 和相对导入

遇到目录形式的导入(如 import package.submodule),Python 把含 __init__.py 的目录识别为包。

  • __init__.py 可为空,也可包含初始化代码或 __all__ 声明
  • 子模块导入时,父包的 __init__.py 会先执行(如果尚未加载)
  • 在包内使用 from . import submodule 是相对导入,依赖 __name____package__ 属性,只能在模块作为包的一部分被导入时生效(不能直接运行 python mypackage/mymodule.py

包结构让模块组织更清晰,但也增加了导入路径和执行顺序的复杂性,尤其在跨包引用时容易出错。

text=ZqhQzanResources