Linux tc / qdisc 的流量整形与限速在 Kubernetes egress 中的应用

7次阅读

tc限速规则在pod网络中不生效，因其默认作用于宿主机物理网卡（如eth0），而pod出向流量经veth对和cni0桥接后才到达该接口；真正生效位置是pod对应的veth设备，需进入pod网络命名空间后对eth0（pod内主网卡）配置tbf限速。

因为默认的 tc 命令作用在宿主机网卡（如 eth0），而 Pod 出向流量通常不经过该接口——它先走 veth 对、再经 docker0 或 cni0 桥接，最后才到物理网卡。直接在 eth0 上加 qdisc，对 Pod egress 流量是“看不见”的。

真正起作用的位置，是每个 Pod 对应的 veth 设备（比如 vethabc123），但这个设备在宿主机上不可见，除非你进入 Pod 的网络命名空间。

核心是：进命名空间 → 找出口设备 → 加 qdisc → 绑定 Filter（可选）。Pod 内部通常没有 tc 命令，所以得用宿主机的 nsenter + tc 组合。

典型流程（以 containerd 为例）：

查 Pod 的 PID：crictl inspect <pod-id> | grep pid</pod-id>，拿到 "pid": 12345
进 netns：nsenter -t 12345 -n tc qdisc show 确认当前无规则
加限速（例如限 1Mbps）：nsenter -t 12345 -n tc qdisc add dev eth0 root tbf rate 1mbit burst 32kbit latency 400ms
eth0 是 Pod 内看到的主网卡名，不是宿主机的 eth0；tbf 比 htb 更简单稳定，适合单速率限速

tbf（Token Bucket Filter）是单速率整形器，行为确定、开销低、无队列调度逻辑，在 Pod egress 限速这种“只压峰值、不保优先级”的场景下更可靠。

htb 需要 class + filter 多层配置，容易因 classid 冲突或 filter 匹配失败导致规则静默失效
sfq 是排队算法，不提供限速能力，单独用它等于没限速
tbf 的 burst 参数必须设（哪怕很小），否则 linux 内核会拒绝加载；latency 控制最大排队延迟，设太小会导致丢包，太大则缓冲膨胀
实测中，burst 小于 rate / 8 * 0.1（即 100ms 窗口数据量）时，http 小包响应延迟明显升高

有人写 DaemonSet 在节点启动时扫所有 Pod 并批量注入 tc，这看似省事，实际埋了三个硬伤：

真正可控的做法，是把 tc 命令塞进容器启动脚本（如 entrypoint.sh），并在 sleep 1 && tc qdisc add... 前加 netns 就绪检测，而不是依赖外部协调。

发表于：php框架

2026-02-18

复制链接

mysql在MacOS中通过命令行配置MySQL服务

欧易OKX交易所官网入口欧易App v6.192.0安卓版官方下载链接