Python 调试复杂问题的系统化方法

3次阅读

用 breakpoint() 最省事但易忘删，推荐 if condition: breakpoint()、-m pdb 手动设断点；Logging.debug 不输出因默认级别为 WARNING，需提前 basicConfig；print 线程不安全，应改用带上下文的 logging；生产环境 bug 多源于环境差异，需打全量日志并启用 faulthandler。

Python 调试复杂问题的系统化方法

怎么用 `pdb` 在关键位置中断而不打断流程

直接在代码里插 breakpoint() 最省事，但容易忘删、上线出事。真正在复杂逻辑里调试，得靠条件断点和临时启用。

用 if condition: breakpoint() 替代无脑插入，比如只在某次循环或特定输入时停住
启动时加 -m pdb（如 python -m pdb script.py），再用 b filename.py:42 手动设断点，比硬编码更可控
别依赖 ide 自带的图形断点——多进程、子线程、信号处理场景下，pdb 命令行反而更稳
breakpoint() 在 Python 3.7+ 默认调用 pdb.set_trace()，但环境变量 PYTHONBREAKPOINT=0 可一键禁用，上线前不用手动删

`logging.debug()` 为什么总不输出

不是日志没写对，大概率是根 logger 的默认级别卡在 WARNING，debug 消息直接被过滤了。

必须显式调用 logging.basicConfig(level=logging.DEBUG)，且得在任何 logging.debug() 调用之前执行
如果用了第三方库（比如 requests 或 sqlalchemy），它们可能有自己的 logger，需单独设级：logging.getLogger("requests").setLevel(logging.DEBUG)
别在模块顶层写 logging.debug("x") —— 模块导入时就执行，但此时 logging 还没配好，消息永远丢失
调试期可临时加 force=True 参数（Python 3.8+）： logging.basicConfig(level=logging.DEBUG, force=True)，避免被其他库提前初始化干扰

多线程/协程里 print 不可靠，该用什么替代

print 是线程不安全的，尤其在高并发或 asyncio 环境下，输出会错乱、截断甚至消失；它也不带上下文，看不出哪条日志来自哪个任务。

统一换成 logging，并开启 %(threadName)s 或 %(name)s 格式字段，一眼区分来源
asyncio 场景下，避免在 async def 里直接调用阻塞型 logger（极少见），但更常见的是忘记给每个 task 命名：asyncio.create_task(coro(), name="fetch_user")，然后用 %(name)s 记录
临时调试时，可用 sys.stderr.write(f"[{threading.current_thread().name}] msgn")，比 print 少一层缓冲，也更轻量
别用 print(..., flush=True) 应对乱序——能缓解但不治本，且在协程中可能触发 RuntimeError

怎么快速定位“只在生产环境出问题”的 bug

本地跑不出 ≠ 代码没问题，大概率是环境差异：时区、编码、文件权限、系统调用返回值、甚至浮点数精度。

立即学习“Python免费学习笔记（深入）”；

加一行 logging.info(f"sys.platform={sys.platform}, sys.version={sys.version}, locale={locale.getpreferredencoding()}")，上线前先看基础信息是否一致
把关键路径的中间值打到日志里，但别打敏感数据；用 repr(x) 而不是 str(x)，能看出 None、空字符串、不可见字符等
检查 os.environ 差异，尤其是 LC_ALL、TZ、PATH —— 很多“本地 OK 生产炸”源于命令行工具找不到或行为不同
用 faulthandler.enable() 开启崩溃堆栈捕获，SIGSEGV/SIGABRT 这类底层错误，普通 try-except 捕不到

真正难缠的，往往藏在环境变量、系统库版本、甚至 CPU 架构导致的整数溢出或内存对齐差异里——日志得多打几层，别只信最后一行报错。

发表于：php框架

近两天内

# bug # ide # if # Logging # print # python # try # 堆 # 多线程 # 字符串 # 并发 # 循环 # 架构 # 栈 # 线程

复制链接

c# 异步方法可以有 ref 或 out 参数吗

thinkphp ORM关联查询如何使用

检测用户代理字符串变化的 JavaScript 实现方法

Linux系统调用如何工作_用户态与内核态解析【指导】

如何在不为正文添加 CSS 的前提下，实现浮动导航栏与自然流式正文的正确布局

Python 调试复杂问题的系统化方法

怎么用 `pdb` 在关键位置中断而不打断流程

`logging.debug()` 为什么总不输出

多线程/协程里 print 不可靠，该用什么替代

怎么快速定位“只在生产环境出问题”的 bug

VSCode如何开发Java应用_配置JDK和扩展有什么要点【教程】

Go 语言垃圾回收机制详解：谁在执行 GC？如何工作？

如何在Golang中搭建开发环境_Golang开发环境配置与搭建步骤

Altova MapForce之外，还有哪些好用的XML映射工具？

如何在c++中实现一个观察者指针(observer_ptr)？ (表达非所有权)

欧易交易平台app下载 OKX官网app下载官方渠道入口

Linux alertmanager 告警规则设计

币安官网入口快速登录币安现货直达指南

如何在 Laravel 中提取模型集合中的指定字段并转为索引数组

chronyc sources 显示 no selectable sources 的 allow / deny 配置

Python 调试复杂问题的系统化方法

怎么用 pdb 在关键位置中断而不打断流程

logging.debug() 为什么总不输出

多线程/协程里 print 不可靠，该用什么替代

怎么快速定位“只在生产环境出问题”的 bug

怎么用 `pdb` 在关键位置中断而不打断流程

`logging.debug()` 为什么总不输出