Python 异常捕获与日志结合

7次阅读

线上服务出错时仅用print()无法满足日志需求:无时间戳、模块名、调用,且日志混入stdout难以被systemd或logrotate管理;应使用Logging.exception()替代,它自动记录完整traceback并强制在except块中调用。

Python 异常捕获与日志结合

为什么 try/except 里直接 print() 不够用

线上服务出错时,只靠 print() 输出异常信息,基本等于没留证据:没时间戳、没模块名、没调用上下文,日志还混在 stdout 里,根本没法被 systemdlogrotate 管理。更麻烦的是,一旦捕获了异常但没重新抛出,错误就静默消失了,后续逻辑可能基于错误状态继续执行。

正确做法是把异常交给 logging 模块处理,它能自动记录 exc_info=True 时的完整 traceback,还能按级别、格式、输出目标做统一管控。

  • 别在 except 块里写 print(e)print(traceback.format_exc())
  • logging.exception() 替代 —— 它等价于 logging.Error(..., exc_info=True),专为异常场景设计
  • 确保根 logger 至少有一个 handler(比如 streamHandlerFileHandler),否则日志会无声丢弃

logging.exception()logging.error() 的关键区别

logging.exception() 是语法糖,但它有强制约束:只能在 except 块中调用,且隐式绑定当前异常上下文(sys.exc_info())。如果在 except 外调用,exc_info 会是 None,日志里看不到 traceback。

logging.error() 则更灵活,但要手动传 exc_info=True 才能打印栈;漏掉这个参数,就只剩一条干巴巴的错误消息。

立即学习Python免费学习笔记(深入)”;

  • logging.exception("请求解析失败") → 自动带 traceback,推荐用于 except
  • logging.error("请求解析失败", exc_info=True) → 效果相同,适合需要动态控制 exc_info 的场景
  • logging.error("请求解析失败") → 没 traceback,容易掩盖问题根源

如何让异常日志包含更多上下文信息

光有 traceback 不够,比如同一个函数被多个 API 调用,得知道是哪个请求触发的异常。可以在 logging.exception() 的消息字符串里拼入变量,或用 extra 参数注入字段。

注意:extra 字典里的键不能和 logging 默认字段重名(如 messagelevelname),否则会报 KeyError

  • 简单拼接:logging.exception(f"用户 {user_id} 下单失败,金额 {amount}")
  • 结构化注入:logging.exception("下单失败", extra={"user_id": user_id, "order_id": order_id}),前提是 formatter 里用了 %(user_id)s 这类占位符
  • 避免在 extra 里传大型对象或未序列化数据,可能引发 TypeError

捕获后是否该重新抛出异常

这取决于你的控制流设计。如果异常已记录,但上层还需要决策(比如重试、降级、返回特定 http 状态码),就必须重新抛出;如果这是最终处理点(比如兜底的全局异常处理器),则不必再抛。

常见错误是捕获后仅记录却未抛出,导致调用方收不到异常,流程卡在错误状态。另一个坑是用 raise e 会丢失原始 traceback,应该用裸 raise

  • 要保留原始堆栈 → 用 raise(不带参数)
  • 要包装异常 → 用 raise NewException("xxx") from e
  • 绝对不要写 raise e,它会切断 traceback 链
  • 异步函数(async def)中同样适用,但需确保 handler 支持异步写入(如用 QueueHandler + QueueListener

异常日志真正起作用的前提,是你清楚每处 except 的职责边界——是终结?还是中转?这点比日志格式重要得多。

text=ZqhQzanResources