Linux 服务启动与自动重启配置

1次阅读

先用 journalctl -u service.service -n 50 -f 查看实时日志,重点关注“failed with result”或“exited, status=”行;再用 systemctl status 快速定位失败摘要,结合 restart=、依赖配置和 daemon-reload 等操作排查。

Linux 服务启动与自动重启配置

systemd 服务启动失败时怎么看日志

服务起不来,别急着改配置,先看 systemd 记录的真实错误。最直接的方式是用 journalctl -u <service-name>.service -n 50 -f</service-name> 实时盯住日志,尤其注意带 Failed with resultexited, code=exited, status= 的行——这些才是真正的死因。

常见错误现象:

  • Failed to start MyApp.service: Unit not found. → 服务文件没放对位置,或没 reload
  • Failed at step EXEC spawning /path/to/app: No such file or DirectoryExecStart 路径写错,或二进制没加执行权限
  • main process exited, code=exited, status=1/FAILURE → 应用本身启动就崩了,得结合应用日志看

实操建议:

  • 改完 .service 文件后,必须运行 sudo systemctl daemon-reload,否则 systemd 完全不认新配置
  • sudo systemctl status <service-name>.service</service-name> 看当前状态和最近一次失败的摘要,比翻长日志快得多
  • 如果服务依赖网络或其它服务(比如数据库),记得在 [Unit] 段加 After=network.targetWants=postgresql.service,否则可能抢在依赖之前启动

让服务崩溃后自动重启的关键参数

不是所有服务都适合自动重启,但多数后台进程(如 API 服务、消息消费者)需要它。核心靠 Restart= 和配套的 RestartSec=,但不同值的行为差异很大,选错反而掩盖问题。

常用组合与适用场景:

  • Restart=on-failure:只在非 0 退出码、被信号终止(如 SIGKILL 除外)、超时等“异常退出”时重启 —— 最常用,适合大多数守护进程
  • Restart=always:不管怎么退出都重启 —— 容易掩盖配置错误(比如每次启动都因参数错退出,然后无限循环),慎用
  • Restart=on-abort:仅当被 SIGABRT 终止才重启 —— 很少用,多见于调试场景

必须配合的参数:

  • RestartSec=5:两次重启之间至少等 5 秒,避免夯住系统;太小(如 1)可能触发 systemd 的 rate limit,导致服务被 temporarily disabled
  • StartLimitIntervalSec=60StartLimitBurst=3:默认 60 秒内最多启动 3 次,超了就锁死 —— 这是保护机制,不是 bug;若真需要高频重启,得显式调大

服务启动顺序和依赖关系怎么写才可靠

很多服务卡在 “activating (start)” 状态不动,八成是依赖没写对。systemd 不是按文件名排序加载,而是严格按 [Unit] 段里的 After=Wants=Requires= 解析依赖图。

关键区别:

  • Wants=:软依赖,目标服务启动失败不影响本服务启动
  • Requires=:硬依赖,目标服务启动失败,本服务直接标记为 failed
  • After=:只控制顺序,不保证目标一定成功;必须搭配 Wants=Requires= 才有意义

实操踩坑点:

  • 想等网络就绪?别写 After=network.service(已废弃),改用 After=network-online.target + Wants=network-online.target
  • 依赖 docker 容器?不要写 Wants=docker.service,而应写 After=docker.service 并确保 docker 已启用(sudo systemctl enable docker
  • 自定义脚本依赖环境变量?EnvironmentFile= 必须放在 [Service] 段开头,且路径必须绝对(如 /etc/myapp/env),相对路径会静默失效

systemctl enable 和 start 的实际效果差异

sudo systemctl start myapp.service 是临时启动,机器重启后就没了;sudo systemctl enable myapp.service 才是让它开机自启——但很多人忽略 enable 的本质:它只是在 /etc/systemd/system/multi-user.target.wants/ 下建个符号链接,指向你的 .service 文件。

所以真正生效的前提是:

  • 服务文件必须放在 systemd 能扫描到的位置:/etc/systemd/system/(推荐,优先级最高)或 /usr/lib/systemd/system/
  • 文件名必须以 .service 结尾,且内容符合语法(可用 sudo systemctl daemon-reload && sudo systemctl cat myapp.service 验证是否被识别)
  • enable 后不会立即启动服务,要手动 start 或重启机器才第一次运行

容易被忽略的细节:

  • 如果服务文件在 /etc/systemd/system/ 下,但名字是 myapp(没后缀),enable 会静默失败,且不报错
  • 修改服务文件后只 enabledaemon-reload,旧配置仍生效;反过来,只 daemon-reloadenable,则下次重启后失效
  • 想彻底禁用?用 sudo systemctl disable myapp.service 删除软链,再 sudo systemctl stop myapp.service 停掉当前实例

复杂点在于:有些服务(比如用 Type=notify 的)要求应用自己调用 sd_notify() 告知 systemd “我准备好了”,否则 systemd 会一直等超时;这种情况下,光配对参数没用,代码里也得配合。

text=ZqhQzanResources