Python socket 通信的完整流程

7次阅读

不需要,socket.connect() 是客户端行为,底层自动分配本地端口;服务端才需 bind() + listen();客户端提前 bind() 通常导致 Address already in use 错误。

Python socket 通信的完整流程

socket.connect() 前必须先调用 socket.bind() 吗?

不需要,而且通常不能这么做。socket.connect() 是客户端行为,它主动发起连接,底层会自动分配本地端口(ephemeral port),无需也不能提前 bind() —— 除非你明确需要固定源端口(比如某些防火墙策略或调试场景)。服务端才需要 bind() + listen()

常见错误现象:

  • 客户端代码里写了 sock.bind(('localhost', 8080)) 再调 connect(),结果报错 OSError: [errno 48] Address already in use 或直接失败
  • 混淆了服务端的绑定逻辑,误以为“所有 socket 都要先 bind”

正确做法:

  • 客户端:创建 socket → 直接 connect()
  • 服务端:创建 socket → bind()listen()accept()

recv() 为什么会卡住、返回空字节或截断数据?

recv() 是底层系统调用,它不保证一次收完应用层消息,只按 TCP 缓冲区当前可用字节数返回。这是最常被忽略的设计事实。

立即学习Python免费学习笔记(深入)”;

典型表现:

  • 发送 b'HELLOnWORLDn',但 recv(1024) 可能只返回 b'HELLOn',下次才收到 b'WORLDn'
  • 对端关闭连接后,recv() 返回空 bytes(b''),不是错误,是正常 EOF 信号
  • 若发送方发得快、接收方 recv 得慢,TCP 窗口机制可能导致粘包或拆包

解决方案取决于协议设计:

  • 简单命令行工具:约定每条消息以换行符结尾,用 makefile().readline()循环拼接直到遇到 n
  • 二进制协议:在包头写明长度(如前 4 字节为 int 表示 body 长度),先 recv 固定 4 字节,再按长度 recv 剩余部分
  • 不要用 recv(1024) 硬切,尤其当消息长度不确定时

为什么 close() 之后还可能收到 FIN 或 RST?

TCP 是全双工协议,close() 默认触发的是「半关闭」流程:它先发 FIN 给对端,但本端仍可读取已到达的剩余数据。真正不可读要等对方也 FIN,或超时后内核清理。

容易踩的坑:

  • 客户端调用 sock.close() 后立刻退出,但服务端刚发出的响应还在网络中,导致丢数据
  • 忽略 shutdown(socket.SHUT_WR),误以为 close() 会立即切断写方向
  • 使用 SO_LINGER 选项强制等待(不推荐),可能阻塞线程

稳妥做法:

  • 发完数据后,调用 sock.shutdown(socket.SHUT_WR) 显式关闭写端
  • 再循环 recv() 直到返回 b'',确保读完对端响应
  • 最后 close()

python 中 socket.settimeout() 和 select() 该怎么选?

settimeout() 简单直接,适合单连接、控制流清晰的场景;select()(或更现代的 selectors)用于单线程管理多个 socket,避免阻塞。

关键差异:

  • settimeout(5.0) 让每个 recv()/connect() 最多等 5 秒,超时抛 socket.timeout继承OSError
  • select([sock], [], [], 5.0) 同时监控多个 socket 的可读/可写状态,返回就绪列表,不阻塞整个线程
  • windows 下 select() 不支持管道和普通文件,而 settimeout() 无此限制

实际建议:

  • 脚本类小工具:用 settimeout() + 异常捕获足够
  • 需同时处理客户端连接和服务端监听(如简单 echo server):优先用 selectors.DefaultSelector,比手写 select() 更健壮
  • 不要混用:给 socket 设了 timeout 还拿去传给 select(),timeout 会被忽略

TCP 连接建立和关闭的细节、缓冲区行为、以及 Python socket 对底层 errno 的封装,才是真正决定通信是否稳定的关键。写几行 demo 很容易,但让它们在弱网、高并发、异常中断下依然可靠,得抠清楚每个系统调用的语义边界。

text=ZqhQzanResources