linux脚本自动化核心在于“稳”,需具备权限校验、失败日志拦截、路径变量防空三道防线;应以systemd服务托管替代cron,配置依赖与重启策略;强制统一日志记录格式并分离配置与代码。

Linux脚本自动化不是堆命令,而是用可维护、可监控、有容错的逻辑代替人工操作——核心在于“稳”,不在“快”。
脚本必须带基础防护机制
没检查就执行,是多数故障的起点。至少三道防线要写进每份生产脚本:
- 权限校验:开头加
[[ $(id -u) -ne 0 ]] && { echo "请用 root 运行"; exit 1; } - 关键命令失败拦截:不用
command || exit 1粗暴中断,改用if ! command; then logger -t myscript "命令失败:command"; exit 1; fi,留日志、可追溯 - 路径与变量防空:比如
[[ -z "$LOG_DIR" ]] && LOG_DIR="/var/log/myscript",避免因环境变量缺失导致写入当前目录甚至根目录
用 systemd 服务托管脚本,别依赖 crontab
cron 适合定时任务,但不负责进程存活、启动顺序和依赖管理。长期运行或需开机自启的自动化任务,应封装为 systemd service:
- 写
/etc/systemd/system/backup-monitor.service,定义Restart=on-failure、StartLimitIntervalSec=60防止频繁崩溃重启 - 用
After=network.target或Wants=postgresql.service显式声明依赖,避免脚本抢在数据库就绪前运行 - 启用后用
systemctl status backup-monitor查状态,journalctl -u backup-monitor -f实时看输出——比翻 cron 日志直观十倍
日志不是可选项,是诊断唯一依据
脚本里所有关键节点都要打点记录,且统一格式便于 grep 和 logrotate 处理:
- 用
logger -t "deploy-v2.3" "开始同步配置文件"写入 syslog,自动归档、按日期轮转 - 避免
echo "done" >> /tmp/log:手动管理路径易混乱,无时间戳,多进程写入会乱序 - 错误日志加
ERR前缀,如logger -t deploy-v2.3 "ERR: rsync 失败,退出码 $?",后续可用journalctl | grep ERR快速定位问题
配置与代码分离,别把密码/地址硬编码
脚本升级时因改 IP 或 Token 导致全量重测?根源常在配置混在代码里:
- 新建
/etc/myscript/config.env,内容如API_URL="https://api.example.com"、DB_USER="app_rw" - 脚本开头加载:
[[ -f /etc/myscript/config.env ]] && source /etc/myscript/config.env - 敏感项(如密码)不放 env 文件,改用
systemd 的 EnvironmentFile=+chmod 600,或通过gpg加密后 on-demand 解密
基本上就这些。稳定不是靠脚本多高级,而是每个环节都默认它会出错,并提前接住——写得慢点,修得少点,睡得踏实点。