Python 蓝绿部署的流量切换脚本模板

2次阅读

python通过验证nginx配置、健康检查、软链接切换和环境隔离实现安全蓝绿部署:先nginx -t校验,再requests检查/health端点,用ln -sf切换current软链接,按env变量加载配置,禁止运行时改环境变量。

Python 蓝绿部署的流量切换脚本模板

蓝绿部署中如何用 Python 安全切换流量(Nginx 场景)

Python 本身不直接控制流量,但能可靠触发 Nginx 配置更新 + 平滑重载,这是最常用、风险最低的蓝绿切换方式。关键不在写多复杂的脚本,而在确保 nginx -t 校验通过、nginx -s reload 不中断连接、且旧版本服务不被误删。

  • 必须先用 subprocess.run(['nginx', '-t'], check=True) 验证配置语法,跳过这步等于埋雷
  • 切换时用 nginx -s reload(不是 restart),避免已有连接断开
  • 蓝/绿目录建议用软链接管理,比如 /var/www/current → /var/www/blue,Python 只改链接目标,不碰真实部署目录
  • 别在脚本里直接 rm -rf 旧版本——等新版本稳定运行 5 分钟后再异步清理

Python 脚本里怎么判断新版本是否就绪(健康检查)

切流量前不验证服务可用性,90% 的“切换失败”都源于此。不能只看进程是否存在,得模拟真实请求路径。

  • requests.get('http://127.0.0.1:8000/health', timeout=3) 检查端点,超时设短(≤3 秒),避免卡住整个流程
  • 健康接口必须返回 200 且响应体含明确标识(如 {"status": "ok", "version": "v2.1"}),光看状态码不够
  • 连续失败 3 次才判定为不可用,单次网络抖动不应导致脚本退出
  • 不要检查数据库连通性——那是部署阶段的事,流量切换阶段只关心当前实例能否响应 HTTP

为什么不用 Python 直接调用 kubernetes API 切 Service?

能用 K8s 原生机制就别绕路。Python 调 patch_namespaced_service 看似灵活,实则引入额外故障点。

  • K8s 的 Service 流量切换是原子操作,但 Python 客户端可能因 Token 过期、API Server 延迟、权限不足而失败,错误信息常是模糊的 ApiException
  • 真正要切的是 Deployment 的 label selector 或 Serviceselector 字段,但修改后需依赖 K8s controller 同步,有秒级延迟,不如直接滚动更新 Deployment
  • 如果非要用 Python 控制,优先调用 kubectl rollout restart deployment/blue 这类封装好的命令,比手写 client 更稳

环境变量和配置怎么隔离蓝/绿两套实例?

蓝绿共存时,配置混用是静默故障主因。Python 脚本本身不该硬编码配置,而应驱动外部配置加载逻辑。

立即学习Python免费学习笔记(深入)”;

  • 每个实例启动时,通过 ENV=blueENV=green 环境变量区分,应用内读取 os.getenv('ENV') 加载对应配置文件
  • 数据库连接池、缓存地址等敏感配置,必须按环境隔离——蓝库和绿库不能共用同一张 users
  • 日志路径也要分环境,比如 /var/log/app/blue/access.log/var/log/app/green/access.log,否则排查时无法对应实例
  • 切流量脚本里禁止出现 os.environ['DB_URL'] = 'xxx' 这类运行时篡改,所有配置应在容器启动时注入

实际最难的不是写脚本,是确认蓝绿两侧的配置、数据、监控指标完全对齐。哪怕只有一处缓存 key 命名规则不一致,切过去就会丢数据——这种问题不会报错,只会慢慢显现。

text=ZqhQzanResources