使用Golang实现发布订阅模式：基于Redis Pub/Sub的封装

2次阅读

redis pubsub 容易丢消息，因其非线程安全、默认缓冲区仅10条、无超时控制易卡死goroutine、重连不自动恢复订阅、无ack机制且panic或慢处理会导致缓冲区溢出。

Go 官方 Redis 客户端（github.com/go-redis/redis/v9）的 PubSub 类型不是线程安全的，且内部缓冲区极小（默认 10 条），一旦消费不及时，新消息会直接被丢弃，连错误提示都没有。

PubSub.Receive() 是阻塞调用，但若在 for range 循环里没做超时控制，整个 goroutine 可能卡死在某条慢消息上，后续消息全积压到缓冲区溢出
客户端断连重连后，PubSub 实例不会自动恢复订阅，必须手动 ps.Subscribe()，而重连期间发布的消息完全不可见
没有内置重试或 ack 机制，遇到 panic 或未捕获 Error 时，当前消息就丢了，且无法回溯

不能把 redis.UniversalClient 和 redis.PubSub 当作全局单例传入封装层 —— 前者可复用，后者是短命对象，每次重连都得重建。

用 redis.NewPubSub 创建实例前，先检查底层连接是否健康：client.Ping(ctx).Err()，失败则重建 PubSub
每个 PubSub 实例只绑定一个 context.Context，并在 context cancel 时显式调用 ps.Close()，否则 goroutine 泄漏
不要复用同一个 PubSub 实例去 Subscribe 多个频道；不同频道建议分实例，避免一个频道异常影响其他

用户注册的回调函数可能 panic、阻塞或耗时过长，这会拖垮整个 PubSub.Receive() 循环，导致缓冲区迅速填满。

每个消息处理都包一层 defer func() { recover() }()，防止 panic 传播
用 context.WithTimeout 给回调加硬性超时，比如 ctx, _ := context.WithTimeout(parentCtx, 5*time.Second)
如果回调返回 error，建议记录日志但不中断循环；若需重试，应把消息内容发回另一个 retry channel，而非原地重执行（Redis Pub/Sub 本身不支持 nack）

调用 ps.Subscribe("chan1") 后，Redis 并不会立刻返回确认，而是通过后续收到的 redis.Message 或 redis.Subscription 类型消息来反馈状态。很多人误以为调用完就 OK 了，结果一直收不到消息。

必须监听 ps.Channel() 中的 redis.Subscription 消息，检查 Channel 字段和 count（>=1 表示已成功加入）
首次订阅后，至少等 1–2 条 Subscription 消息（subscribe/unsubscribe）后再开始处理业务消息，否则可能漏掉第一条
生产环境建议加心跳检测：定期 PING Redis 并检查 ps.Ping() 是否返回 redis.nil（表示连接正常）

实际跑通的关键，往往卡在「以为订阅完了」和「其实还没收到确认」之间。Redis Pub/Sub 本身不保证投递，封装层能做的，只是让丢消息这件事变得可观察、可拦截、可收敛。

发表于：后端开发

近三天内

复制链接

C++怎么使用CMake_C++构建工具教程【规范】

正则表达式实现“前三字母逐个拆分 + 驼峰式后续分割”的精准解析