Linux trace-cmd record / report / profile 的火焰图生成完整链路

4次阅读

必须显式指定-e sched:sched_switch和-e sched:sched_wakeup才能捕获完整调度路径，避免火焰图平顶；通配-e sched会漏迁移到事件，锁分析还需加-e lock:lock_acquired等。

trace-cmd record 怎么选 -e 事件才不漏关键调度路径

trace-cmd record 默认不抓调度事件，光录 syscalls 或 irq 画不出调度延迟火焰图。必须显式加 -e sched:sched_switch 和 -e sched:sched_wakeup，否则 trace-cmd report 里看不到进程切换上下文，火焰图里全是平顶——不是没热点，是根本没录到。

sched:sched_switch 是必选，它记录每次 CPU 上下文切换的 from → to 进程
sched:sched_wakeup 补上唤醒链，能看清谁把谁叫醒、为什么阻塞
避免用 -e sched（通配），内核 5.10+ 会默认禁用部分低频事件，反而漏掉 sched_migrate_task 这类跨 CPU 迁移线索
如果目标是锁竞争，得额外加 -e lock:lock_acquired 和 -e lock:lock_contended，不然火焰图里只看到 mutex_lock 调用，看不到谁在等谁

trace-cmd report 输出的 trace.dat 怎么喂给 FlameGraph

trace-cmd report 本身不输出文本堆栈，直接拿它的 stdout 去管道进 stackcollapse-perf.pl 会失败——因为格式是人类可读的事件流，不是 perf 格式。必须先用 trace-cmd extract 抽成二进制 trace.dat，再转成 perf 兼容格式。

正确链路：trace-cmd extract -o trace.dat（生成 trace.dat）→ perf script -F comm,pid,tid,cpu,time,period,Event,ip,sym,dso -F callgraph=fp -i trace.dat 2>/dev/NULL → 管道进 stackcollapse-perf.pl
注意 perf script 的 -F callgraph=fp 参数：必须显式指定，否则默认用 dwarf，而 trace-cmd 录的栈帧没 dwarf info，结果全是 [unknown]
如果 perf script 报错 “no symbols found”，不是符号没加载，是 trace-cmd 录的时候没开 --call-graph fp（但 trace-cmd 不支持该参数），所以只能靠 kernel 启用 CONFIG_FRAME_POINTER=y 编译，否则 fp 栈不可用

trace-cmd profile 为什么比 record + report 更适合快速看 CPU 占用热点

trace-cmd profile 是个快捷命令，底层自动启用 function_graph + sched + irq 事件，并做轻量聚合，省去手动挑事件、调 buffer size、防丢包的步骤。但它默认关掉了高精度时间戳，profile 输出的延迟分布会抹平 sub-millisecond 级抖动。

适合场景：快速定位哪个函数吃 CPU 最多，比如发现 ext4_writepages 占 40%，不用深挖调度细节
不适合场景：分析单次系统调用延迟毛刺，或确认某个 sched_wakeup 到 sched_switch 的精确间隔
它生成的 trace.dat 可直接用 trace-cmd report 查看，但火焰图效果不如 record -e sched* 细致——因为没录 full stack trace，只有函数入口/出口点
如果想保留精度又省事，改用：trace-cmd record -e sched:sched_switch -e sched:sched_wakeup -e irq:irq_handler_entry -r 8192 -b 8（增大 ring buffer 和子 buffer）

火焰图里出现大量 [unknown] 或 [k] 符号怎么修

[unknown] 不是工具坏了，是用户态符号或内核符号没对齐。常见原因有三个：符号文件路径不对、内核版本不匹配、或者 perf 没权限读 /proc/kallsyms。

检查 perf script 是否能解析内核符号：perf script -F sym | head -5，如果全是 [k] 或地址，说明 /proc/kallsyms 权限不足（需 root 运行 trace-cmd record，否则 kallsyms 为空）
用户态符号丢失：确保程序编译带 -g，且运行时没 strip；若用容器，宿主机和容器内 /proc/pid/root 下的二进制要一致
内核符号不匹配：uname -r 输出的版本必须和 /lib/debug/lib/modules/$(uname -r)/vmlinux 存在且校验通过，缺 vmlinux 就会 fallback 到地址，火焰图里就是一堆 0xffffffff81123abc

火焰图不是万能放大镜，它依赖 trace-cmd 录什么、perf 解什么、符号在哪——三个环节断一个，图就变“抽象派”。最常被跳过的其实是录之前确认 cat /proc/sys/kernel/kptr_restrict 是 0。

发表于：运维

五天前

复制链接

c++中模板参数包(parameter pack)如何展开？ (折叠表达式)

Linux中如何配置环境变量_Linux环境变量配置的正确方法

Linux如何启用双因素认证_Linux双因素认证的设置方法详解

什么是生成器函数在javascript中_怎样使用yield控制执行流程【教程】

如何在 React-Leaflet 地图上通过点击添加标记与环绕圆圈

Linux trace-cmd record / report / profile 的火焰图生成完整链路

trace-cmd record 怎么选 -e 事件才不漏关键调度路径

trace-cmd report 输出的 trace.dat 怎么喂给 FlameGraph

trace-cmd profile 为什么比 record + report 更适合快速看 CPU 占用热点

火焰图里出现大量 [unknown] 或 [k] 符号怎么修

Golang实现简单的端口转发工具_本地与远程流量中转

c++中decltype关键字如何推导类型_c++类型查询技巧【详解】

C++ 怎么计算程序耗时 C++ chrono高精度计时器使用教程【测试】

Go语言中sync.WaitGroup不等待的常见闭包陷阱解析

如何将嵌套数组数据按顺序注入同名 class 的多个 DOM 元素中

CSS原子化类库的引入_Tailwind CSS的配置与安装

CSS加载状态过渡_结合伪元素实现简单的Loading视觉

Laravel怎么实现无限级分类 _ Laravel 递归模型查询方法【教程】

Composer怎么发布包到码云Gitee_国内源发布Composer包教程【干货】

SQL PostgreSQL 的 jit_above_cost / jit_optimize_above_cost 的 JIT 编译阈值实践