Linux 进程生命周期完整解析

11次阅读

fork()后父子进程谁先运行无确定顺序,由内核CFS调度器决定;子进程退出后父进程不wait()会导致僵尸进程;子进程未exec时必须用_exit()而非exit()。

Linux 进程生命周期完整解析

fork() 后父子进程谁先运行?

没有确定顺序。fork() 返回后,父子进程谁先被调度执行,完全由内核 CFS 调度器决定,不是“子进程一定等父进程 return 之后才跑”。很多新手写测试代码发现子进程总在父进程后面打印,误以为是顺序保证——那只是运气好或负载低下的巧合。

  • 若需严格同步(比如父进程必须等子进程初始化完再发数据),必须显式调用 waitpid() 或使用 pipe()/signal() 等 IPC 机制
  • 循环 fork 场景(如预分叉服务器)中,不加同步极易引发竞态,比如多个子进程同时尝试绑定同一端口而失败
  • fork() 实际开销极小,靠写时复制(copy-on-Write)延迟物理页拷贝;但若子进程立即大量写内存(如 deep copy 大结构体),反而比直接 malloc 更慢

execve() 失败的常见原因和调试方法

execve() 不创建新进程,只替换当前进程映像;它成功就永不返回,失败才返回 -1 并设置 errno。最常见的失败不是“找不到文件”,而是路径、权限或解释器问题。

  • 路径错误:execve("ls", ...) 失败(ENOENT),必须用 "./ls""/bin/ls";想自动查 $PATH,改用 execvpe()
  • 脚本无 #!:比如执行 ./deploy.sh 时内核报 ENOEXEC,说明该脚本第一行缺失 #!/bin/bash 或解释器路径不可达
  • 权限不足:目标文件无可执行位(chmod +x 缺失),或位于 noexec 挂载分区(如某些 tmpfs)
  • 调试技巧:在 exec 前加 printf("about to exec: %sn", argv[0]); fflush(stdout);,避免因缓冲区未刷导致日志丢失

子进程退出后,父进程不 wait() 会怎样?

子进程变成僵尸(Z 状态),ps 显示 STAT 列为 Z,PID 无法复用,长期积累会耗尽进程表(/proc/sys/kernel/pid_max 限制)。注意:僵尸本身不占内存/CPU,但它的 task_struct 和退出状态仍驻留内核。

  • 临时补救:父进程调用 waitpid(-1, &status, WNOHANG) 非阻塞回收;或注册 SIGCHLD 信号处理器,在其中循环 waitpid()
  • 彻底省事:父进程启动前设 signal(SIGCHLD, SIG_IGN)linux 2.6+ 内核会自动清理(但注意:某些旧系统或容器环境可能不生效)
  • 双 fork 技巧:子进程再 fork 一个孙进程后立即 _exit(),孙进程被 init 收养,自然由 init 负责 wait —— 常用于守护进程脱离终端

exit() 和 _exit() 在 fork 后到底该用哪个?

子进程若已调用 execve(),用 exit()_exit() 都行;但若没 exec(比如只做计算就退出),**必须用 _exit()**,否则可能重复刷新父进程的 stdio 缓冲区,导致日志错乱或文件写入异常。

  • 根本原因:fork 后父子进程共享底层文件描述符(fd),但各自有独立的 FILE* 结构体;exit() 会 flush 所有打开的 FILE*,而父子 fd 指向同一文件,造成重复写
  • 典型现象:父进程 printf(“donen”) 后 fork 子进程,子进程直接 exit(0),结果终端看到两行 “done”
  • 安全习惯:fork 后的子进程,只要不 exec,退出一律用 _exit();父进程则可用 exit()(需确保不依赖子进程 flush 行为)

实际写服务程序时,最容易被忽略的是 _exit() 的使用时机和 SIGCHLD 信号处理的异步安全性——比如在信号处理器里调用 printf()malloc() 会引发未定义行为,必须只用 async-signal-safe 函数(如 write()_exit())。

text=ZqhQzanResources