Python 无状态函数的设计优势

2次阅读

无状态函数更易测试因无隐藏依赖，输入确定则输出确定，外部依赖（时间、配置、io等）需显式传参；随机性通过外置rng参数解决；partial需避免提前求值；性能影响通常可忽略，但需注意rng初始化和大对象传递。

Python 无状态函数的设计优势

因为没隐藏依赖，输入确定、输出就确定，不用 mock 全局变量或类实例。你改一个 datetime.now() 调用，整个测试就可能飘；但把时间作为参数传进来，测试时直接塞个固定 datetime(2024, 1, 1) 就完事。

常见错误现象：写了个 get_user_stats()，内部偷偷调了 os.getenv("DB_URL") 和 requests.get()，结果单元测试跑不通，还得配环境变量、启 mock server。

Python 的 random 模块默认用全局状态，同一段代码多次运行结果不同，违反无状态原则。解决办法不是禁用随机，而是把随机源“外置”。

使用场景：生成测试数据、抽样、加噪。比如你写了个 sample_items(items, k)，它内部用了 random.sample()，那测试就不可靠。

functools.partial 看似让函数“带参固化”，其实只是包装器，底层还是可能隐含状态。比如你 partial 了一个带 time.time() 的函数，每次调用依然会取当前时间。

错误示范：log_now = partial(print, datetime.now(), "[INFO]") —— datetime.now() 在定义时就执行了，不是每次调用都算。

多数情况下可以。Python 函数调用开销本身不大，传几个额外参数几乎不影响速度。但有两个真实瓶颈点容易被忽略：

频繁创建新 RNG 实例（比如每轮循环都 Random(seed)）比复用一个快得多——状态本身不是问题，反复初始化才是
把大对象（如 pandas DataFrame、大型 dict）作为参数传入，看似无状态，实则引发隐式拷贝或引用混淆；这时该用 copy=False 显式控制，或改用只读视图
某些 C 扩展函数（如 re.compile()）缓存依赖全局状态，即使你的函数无状态，底层仍可能因缓存失效变慢

真正难的不是写无状态函数，是识别哪些“看起来像参数”的东西其实是隐藏状态——比如一个类的 .config 属性，表面是字段，背后连着环境变量或文件读取。

发表于：数据库

近一天内

复制链接

composer如何防止意外提交vendor目录？（.gitignore最佳实践）

如何正确处理以分为单位的价格并精确计算含税金额（保留两位小数）