Python memray 的火焰图与实时分析

2次阅读

memray火焰图看不到python函数名是因为默认不采集python帧信息,需添加–record-python-allocations参数启用,但会带来2–3倍性能开销。

Python memray 的火焰图与实时分析

memray flamegraph 为什么看不到 Python 函数名

默认生成的火焰图里只有 C 扩展函数或地址,Python 层调用空白——这是因为 memray 默认不采集 Python 帧信息,得手动开开关。

  • 运行时必须加 --record-python-allocations 参数,否则 flamegraph 只能显示 mallocPyObject_Malloc 这类底层分配点
  • 如果用了 memray run --live 实时模式,这个参数同样要带上,不然 Web ui 里也看不到 Python 函数
  • 开启后性能开销明显增加(约 2–3 倍),只在定位内存热点时启用,别长期开着

memray live 模式连不上 localhost:8080

启动 memray run --live 后浏览器打不开,或者提示连接被拒绝,大概率是端口冲突或权限问题。

  • 默认端口是 8080,但 macos 上可能被 AirPlay 占用,linux/macOS 可改用 --web-port 8081
  • windows 用户如果开了 Hyper-V 或 WSL2,localhost 可能解析失败,试试用 127.0.0.1:8080 直连
  • 某些公司网络策略会拦截非标准端口,临时关掉代理或换企业允许的端口范围(如 8000–8999

memray 分析结果里 [unknown] 占比太高

火焰图或统计表里大量 [unknown],说明符号信息缺失,无法回溯到具体代码行。

  • 确保 Python 是从源码编译安装的(不是 pyenv prebuilt 或 conda 的 stripped 版本),否则调试符号被裁剪
  • python -m pip install --no-binary :all: memray 安装,避免 wheel 包跳过本地编译步骤
  • 如果项目用了 Cython 或 C 扩展,得在编译时加 -g 选项保留 debug info,否则 memray 拿不到函数名

实时分析时 CPU 突增到 100%,但内存没涨

memray --live 自身吃 CPU 高,和目标程序内存增长无关,这是采样机制导致的固有代价。

立即学习Python免费学习笔记(深入)”;

  • 默认每毫秒采样一次,对高频小对象分配(比如循环里建 dict/list)压力极大;可加 --sampling-rate 10 降到每 10ms 一次
  • Web UI 每秒轮询数据,如果火焰图层级太深(>50 层),前端渲染也会卡顿,这时关掉火焰图、只看「Top Allocators」更稳
  • 别在生产环境长期跑 --live,它本质是调试工具,上线前换成 memray run -o report.bin 离线分析

真正难的是平衡采样精度和干扰程度——采得太密,程序行为就失真;采得太疏,又抓不到瞬时峰值。实际调试时,先用低频跑通路径,再局部提频验证,比一上来就全量埋点靠谱得多。

text=ZqhQzanResources