Linux 网络问题定位的工具链

9次阅读

排查网络问题需分层验证：先用 ping/traceroute 初判连通性，再以 nc/telnet 测试端口可达性；用 ss 替代 netstat 查监听状态；tcpdump 抓包须精准过滤并保存分析；dns 与路由问题优先用 dig/ip route 定位。

Linux 网络问题定位的工具链

排查网络连通性用 `ping` 和 `traceroute`，但别只看通不通

ping 看的是 ICMP 回包，很多防火墙会丢弃 ICMP，所以“ping 不通”不等于“端口不通”。真正要确认服务可达，得用 telnet 或 nc -zv 测试目标端口。比如：nc -zv example.com 443。如果超时，可能是路由问题、中间设备拦截，或目标服务根本没监听该端口。

traceroute（或 mtr）能暴露路径上哪一跳开始丢包或延迟突增。注意：某些节点会屏蔽 ICMP TTL-exceeded 响应，导致显示 * * *，这不是故障，是策略限制。实际定位时，优先在跳数变化点前后比对路由表和防火墙规则。

`ss` 比 `netstat` 更快更准，重点看监听状态和连接队列

netstat 已被标记为废弃，ss 是替代方案，输出更简洁、解析更快。查本机监听端口，用：ss -tuln（-t TCP, -u udp, -l listening, -n 数字地址）。特别留意 State 列：如果是 LISTEN 但无进程名（ss -tulpn 才能显示），说明可能没权限读取 /proc；若状态是 SYN-RECV 且堆积多，大概率是 SYN Flood 或应用 accept 队列溢出。

常见误判点：

看到 :80 监听就认为 nginx 在跑——其实可能是其他进程绑定了 0.0.0.0:80，而 Nginx 配的只是 127.0.0.1:80
忽略 Recv-Q 和 Send-Q：非零值说明有数据积压，需结合应用日志判断是处理慢还是网络卡顿

抓包必须用 `tcpdump`，过滤条件写错等于白抓

直接 tcpdump -i any port 80 容易被海量包淹没。先缩小范围：指定网卡（如 eth0）、协议（tcp）、方向（src host 192.168.1.100）、甚至 TCP 标志位（'tcp[tcpflags] & tcp-syn != 0'）。保存到文件用 -w capture.pcap，之后用 wireshark 分析更可靠。

容易踩的坑：

没加 -s 0 导致截断包体，默认只捕前 68 字节，看不到 http 头或 TLS Client Hello
在虚拟化环境抓包，选错接口（比如抓了 docker0 却想看宿主机外网流量）
忘记 sudo 权限，报错 socket: Operation not permitted

路由和 DNS 问题优先查 `ip route` 和 `dig`，别依赖 `nslookup`

ip route get 8.8.8.8 能模拟内核选路过程，返回实际走哪条路由、用哪个源地址、是否经由 gateway。比 route -n 更贴近真实转发逻辑。DNS 方面，dig +short google.com @114.114.114.114 明确指定上游服务器，绕过系统 resolver 缓存干扰；而 nslookup 默认走 /etc/resolv.conf，还带交互式提示，脚本里难解析。

典型混淆场景：

curl 报 Could not resolve host，但 ping 域名却成功——说明 DNS 解析正常，问题在 curl 的 DNS over https 或自定义 resolv.conf 配置
ip route 显示 default via，但 curl -v http://example.com 卡在 CONNECT——可能 MTU 不匹配或中间设备干扰 TCP MSS

真实网络问题往往跨层叠加，比如 DNS 解析慢（应用层）+ 本地路由错误（网络层）+ 连接队列满（传输层）同时发生。工具链不是顺序执行，而是根据现象快速交叉验证：一个 ss 发现端口未监听，就不用再 ping；dig 返回 NXDOMaiN，tcpdump 就该去抓 DNS 查询包而非 HTTP 流量。

发表于：后端开发

2026-01-26

# ai # curl # default # dns # docker # gateway # go # google # http # https # linux # nginx # tcpdump # udp # wireshark # 堆 # 字节 # 工具 # 接口 # 端口 # 虚拟化 # 路由 # 防火墙

复制链接

php7数组把前面去掉操作_php移除数组首部元素技巧【教程】

c++中的std::string_view和std::string有什么性能差异_c++ string_view与string性能比较

Python中根据特定行值分组列表数据为字典

c++中如何使用std::is_same_c++模板元编程判断类型相同【详解】

html个人页面项目经历怎么排_html项目列表布局教程【排版】

Linux 网络问题定位的工具链

排查网络连通性用 `ping` 和 `traceroute`，但别只看通不通

`ss` 比 `netstat` 更快更准，重点看监听状态和连接队列

抓包必须用 `tcpdump`，过滤条件写错等于白抓

路由和 DNS 问题优先查 `ip route` 和 `dig`，别依赖 `nslookup`

Composer怎么安装Debugbar 调试工具条集成教程【实操】

php格式文件用phpstorm打开怎么设置_phpstorm打开php配置【步骤】

如何通过 URL 参数自动触发 AJAX 搜索并预填充搜索框

VSCode与Google Cloud Platform集成指南

SQL 使用 JOIN 实现层级查询

Apache如何调整PHP文件解析顺序_配置默认索引页包含PHP的操作【技巧】

mysql事务是否支持嵌套事务_mysql嵌套事务解析

Laravel怎么集成微信支付_Laravel使用EasyWeChat插件【必备】

mysql执行SQL时如何读取数据_mysql数据存取流程

PHP后门怎么删除_误删正常文件如何快速找回补救【汇总】

Linux 网络问题定位的工具链

排查网络连通性用 ping 和 traceroute，但别只看通不通

ss 比 netstat 更快更准，重点看监听状态和连接队列

抓包必须用 tcpdump，过滤条件写错等于白抓

路由和 DNS 问题优先查 ip route 和 dig，别依赖 nslookup

排查网络连通性用 `ping` 和 `traceroute`，但别只看通不通

`ss` 比 `netstat` 更快更准，重点看监听状态和连接队列

抓包必须用 `tcpdump`，过滤条件写错等于白抓

路由和 DNS 问题优先查 `ip route` 和 `dig`，别依赖 `nslookup`