Linux自动化运维项目教程_Ansible脚本批量管理实践

16次阅读

ansible 是轻量级 agentless 运维工具,依赖 sshpython,通过 playbook(YAML)、inventory 分组与变量管理实现批量部署、配置同步等;需按角色环境分组、用 vault 加密敏感变量、聚焦单一职责编写 playbook、善用模板与条件判断,并严格验证语法、模拟执行及小范围试跑。

Linux自动化运维项目教程_Ansible脚本批量管理实践

Ansible 是 linux 自动化运维中最轻量、最易上手的配置管理工具之一,无需在被控节点安装客户端(agentless),仅靠 SSH 和 Python 就能完成批量部署、配置同步、服务启停等任务。关键在于写好 playbook(YAML 格式脚本),并合理组织 inventory(主机清单)和变量。

Inventory 主机分组与动态管理

Inventory 是 Ansible 的“目标清单”,可静态定义(INI 或 YAML 格式),也可通过脚本动态生成(如从 CMDB 或云平台拉取)。生产环境推荐按角色+环境分组,例如:

  • web_servers:包含所有 nginx/HTTPD 节点,附带 http_port: 8080 变量
  • db_masters:主数据库节点,启用 mysql_root_password 等敏感变量(建议用 ansible-vault 加密)
  • monitoringprometheusgrafana 所在节点,统一打上 role: monitor 标签便于条件执行

使用 ansible-inventory --graph 可快速查看分组结构;配合 --limit 参数(如 --limit 'web_servers:&staging')可精准控制执行范围。

Playbook 编写要点与复用技巧

一个清晰的 playbook 应聚焦单一职责(如 “部署 java 应用” 或 “加固 SSH 配置”),避免大而全。常用结构包括:

  • vars_files 拆分变量,按环境(dev.yml / prod.yml)或模块(nginx_vars.yml / jdk_vars.yml)存放
  • include_tasksimport_role 复用逻辑,比如把用户创建、sudo 权限、SSH 密钥分发封装成独立 role
  • 关键步骤加 when 判断(如 when: ansible_distribution == "centos")适配多发行版
  • 敏感操作前加 check_mode: no 或用 changed_when 明确标记状态,方便后续幂等判断

常见批量任务实战示例

以下命令级操作均可转为 playbook 实现,且支持回滚与验证:

  • 批量安装软件包:用 yumapt 模块,指定 state: latest 并设 update_cache: yesdebian 系需先更新源)
  • 同步配置文件:用 template 模块渲染 Jinja2 模板(如 /etc/nginx/nginx.conf.j2),自动注入 IP、端口、证书路径等变量
  • 滚动重启服务:结合 serial: 2wait_for 模块,确保每批两台节点服务就绪后再继续
  • 日志清理与磁盘检查:用 shell 模块执行 find /var/log -name "*.log" -mtime +30 -delete,再用 assert 校验 / 分区使用率是否低于 85%

调试与上线前必做事项

Ansible 执行速度快但容错低,上线前务必验证:

  • ansible-playbook --syntax-check 检查 YAML 语法
  • --check --diff 模拟运行,观察哪些文件将被修改(尤其 template 和 lineinfile)
  • 小范围试跑(--limit @site.yml 中指定测试组),确认无误再全量执行
  • 记录每次变更:ansible-playbook deploy.yml --extra-vars "deploy_version=2.3.1 deploy_by=ops",便于审计追踪

不复杂但容易忽略。

text=ZqhQzanResources