Python 性能优化思路：局部变量、循环优化与生成器

11次阅读

局部变量比全局变量快，因python用LOAD_FAST直接索引栈帧，而LOAD_GLOBAL需遍历模块字典；循环中应避免字符串累加、重复类型检查和冗余索引；生成器适合大数据流式处理，小数据全量消费时反增开销。

Python 访问局部变量走的是 LOAD_FAST 指令，而全局变量是 LOAD_GLOBAL，后者要遍历模块字典、可能触发属性查找，慢 2–5 倍。这不是“微优化”，在高频循环里会明显拖累。

实操建议：

把频繁使用的全局对象（如 math.sin、re.compile() 的结果）提前赋值给函数内变量
避免在循环中重复写 import os 或 from json import loads —— 导入本身不耗时，但引用时若没缓存，会多一次命名空间查找
用 dis.dis() 看字节码验证：局部变量对应 LOAD_FAST，全局/内置名是 LOAD_GLOBAL 或 LOAD_BUILTIN

真正拖慢循环的往往不是迭代本身，而是每次迭代中隐式开销大的操作。比如反复调用方法、拼接字符串、做类型检查。

常见错误现象：

改法示例：

# 慢 s = "" for x in items:     s += str(x) 快s = "".join(str(x) for x in items)

生成器节省内存，但未必省时间。它把计算延迟到取值时，如果所有值最终都要被消费，且中间没有过滤/截断，那生成器反而增加函数调用开销（yield 是协程调度点）。

使用场景判断：

一个易忽略点：yield from 在嵌套生成器时比手动 for...yield 快约 10%——Cython 编译后差距更大。

用 cProfile.run('foo()') 或 line_profiler 才能定位真实瓶颈。很多人优化了 math.sqrt() 调用，却没发现 90% 时间花在 json.loads() 的字符串解码上。

关键提醒：

局部变量优化只有在函数被高频调用（如每秒数千次）时才值得单独提取
生成器的 yield 开销约 50–100ns，单次不明显，但嵌套三层+每秒百万次就不可忽视
for x in iterable 的底层是 iter() + next()，如果 iterable 是自定义类，__iter__ 和 __next__ 实现质量直接影响性能

发表于：php框架

2026-01-27

复制链接

什么是加密货币杠杆？使用方法与风险解析

快