ps、top、kill等命令。通过ps和top查看进程状态,利用kill、killall和pkill终止失控进程,结合&、nohup及jobs命令实现后台运行与作业控制,并通过nice、renice调整优先级,辅以free、df、lsof等工具监控资源,形成“观察—分析—干预”的系统管理闭环。rc="htt
://img.php.cn/upload/apsrticle/000/969/633/175810014388122.jpeg" alt="Linux进程管理基础命令总结">
Linux进程管理,在我看来,核心就是理解并掌控系统上所有正在“忙碌”的程序。它不只是敲几个命令那么简单,更是一种深入洞察系统状态、优化资源分配、甚至在关键时刻力挽狂澜的能力。掌握这些基础命令,就好比拥有了一套透视镜和操作杆,能让你清晰地看到系统的心跳,并适时进行干预。
解决方案
在我日常的Linux运维和开发工作中,进程管理是绕不开的话题。无论是排查系统资源占用过高的问题,还是确保某个服务稳定运行,亦或是将耗时任务放到后台执行,一套清晰的思路和熟练的命令操作是必不可少的。我的方法论是:先观察,再分析,最后才动手干预。这意味着我们要先用工具看清当前有哪些进程,它们的状态如何,占用了多少资源;接着根据观察到的现象,结合系统日志或应用行为进行判断;最后,才决定是调整优先级、发送信号终止,还是将其转为后台运行。这个过程不是线性的,往往需要反复迭代,但核心始终是围绕着“查看”、“控制”和“调度”这三大方面展开。
如何查看Linux系统中正在运行的进程?
要理解系统在做什么,第一步无疑是查看当前运行的进程。这方面,我最常用且觉得最基础的工具就是
re>ps
和
re>top
,它们各有侧重。
re>ps
命令,全称是“process status”,它能提供某一时刻的进程快照。我个人最喜欢用
re> auxps
和
re> -efps
这两个组合。
re>
re>auxps:这个命令会列出所有用户(a)、所有终端(x)上的进程,并且会显示详细信息,比如进程的用户、
PID(进程ID)、CPU和内存占用百分比、启动时间以及完整的命令。它给我的感觉就像是打开了一扇窗,瞬间看到系统里所有正在发生的事情。举个例子,如果我想找一个特定的服务,比如Nginx,我可能会这样用:re>
re>aux | gpsrep nginx。
re>
re>aux | head -n 5ps输出示例:
re>
re>USERPID %CPU %MEMVSZ RSS TTY STAT START TIME COMMANDroot 1 0.0 0.0 170892 10880 ? Ss Oct26 0:02 /sbin/initroot 2 0.0 0.0 0 0 ? S Oct26 0:00 [kthreadd]root 3 0.0 0.0 0 0 ? I< Oct26 0:00 [rcu_gp]root 4 0.0 0.0 0 0 ? I< Oct26 0:00 [rcu_par_gp]re>
re>-efps:这个命令会以BSD风格显示所有进程,包括父进程ID(
PPID)。在需要追踪进程的父子关系时,这个命令就显得特别有用。比如,我想知道某个进程是由哪个服务启动的,re>
re>-ef | gpsrep [process_name]就能帮我定位。
re>
re>-ef | head -n 5ps输出示例:
re>
re>UIDPIDPPID C STIME TTY TIME CMDroot 1 0 0 Oct26 ? 00:00:02 /sbin/initroot 2 0 0 Oct26 ? 00:00:00 [kthreadd]root 3 2 0 Oct26 ? 00:00:00 [rcu_gp]root 4 2 0 Oct26 ? 00:00:00 [rcu_par_gp]
而
re>top
命令,则提供了一个实时动态的视图。它就像一个仪表盘,持续更新CPU、内存使用情况以及进程列表。我经常用它来快速定位系统瓶颈,比如哪个进程突然吃满了CPU。在
re>top
界面里,我可以通过按键进行交互操作,比如按
re>M
按内存使用排序,按
re>P
按CPU使用排序,按
re>k
可以杀掉进程,按
re>r
可以调整进程优先级。
为了更直观,我个人更偏爱
re>htop
。它不是Linux自带的,但安装后体验非常好,提供了一个彩色的、交互性更强的界面,像一个增强版的
re>top
。你可以用鼠标点击列头排序,用F键进行各种操作,非常方便。
当一个进程失控时,我们应该如何有效地终止它?
有时候,程序会陷入死循环、内存泄漏,或者干脆就是僵死不动,这时候就需要我们手动“干预”了。终止进程的命令主要是
re>kill
和
re>killall
,但这里面学问可不小,不能随便乱用。
re>
re>kill命令:顾名思义,就是“杀死”进程。它通过向指定
PID发送信号来终止进程。最常用的信号是re>SIGTER
re>M(信号15)和
re>
re>SIGKILL(信号9)。
re>
re>killPID或
re>
re>kill -15PID:这是最“礼貌”的终止方式。
re>SIGTER
re>M信号会请求进程优雅地退出,给它时间来清理资源、保存数据。我通常会优先使用这种方式,因为它能最大程度地减少数据丢失或系统状态不一致的风险。如果一个服务正在处理请求,它可能会等待当前请求处理完毕再退出。
re>
re>kill -9PID:这是“强制”终止。
re>
re>SIGKILL信号会直接让操作系统强制终止进程,不给它任何清理的机会。这就像拔掉电源一样,简单粗暴,但有效。我只在进程对
re>SIGTER
re>M无响应时才使用
re>
re>kill -9,因为它可能导致数据损坏或资源泄露。
举个例子,如果我发现一个
PID为12345的进程卡住了:re>
re>kill 12345 # 尝试温柔地终止 # 如果进程依然存在kill -9 12345 # 强制终止re>
re>killall命令:如果你知道进程的名字,而不是
PID,re>
re>killall就非常方便了。它会向所有匹配指定名称的进程发送信号。比如,我想关闭所有Nginx工作进程:
re>
re>killall nginx # 默认发送SIGTERMkillall -9 nginx # 强制终止所有Nginx进程使用
re>
re>killall时要特别小心,因为如果系统中有多个同名进程,它会全部终止,这在生产环境操作时需要格外谨慎。
re>p
re>kill命令:这是一个更灵活的工具,它允许你根据进程名的一部分、用户、终端等多种条件来杀死进程。比如,我想杀死所有由用户
re>
re>john运行的进程:
re>p
re>kill -ujohn或者杀死所有名称中包含“python_sc
ript”的进程:re>p
re>kill -f python_scriptre>p
re>kill在脚本中处理特定场景时非常强大,但同样需要精确匹配,避免误杀。
在实际操作中,我总会先用
re> aux | gpsrep [process_name]
确认进程的存在和PID,然后尝试温柔的
re>kill
,如果不行,再考虑
re>kill -9
。这是我的基本原则,确保操作的安全性和有效性。
如何在后台运行命令或管理作业?
很多时候,我们运行的命令或脚本需要执行很长时间,或者我们希望它们在终端关闭后仍然继续运行。这时候,将它们放到后台运行就变得至关重要。
rong> re>
re>&amp;符号rong>:这是最直接的方式。在命令的末尾加上
re>
re>&amp;,就能让它立即在后台运行。
re>my_long_
re>running_script.shamp;&amp;这样,你就可以继续在当前终端输入其他命令了。不过,这种方式有一个限制:如果你的SSH会话断开,这个后台进程通常也会随之终止。
rong> re>Ct
re>rl+Z,
re>
re>jobs,
re>
re>bg,
re>
re>fgrong>:
ref="htt://phps.yycxw.com/ai/luminal">psrc="htt
://img.php.cn/upload/ai_manual/001/503/042/68b6d51ebc357953.png" alt="Linux进程管理基础命令总结">psref="htt://phps.yycxw.com/ai/luminal">Luminalps用AI以光速清理、转换和分析电子表格
rc="htt
://phps.yycxw.com/static/images/capsrd_xiazai.png" alt="Linux进程管理基础命令总结">73如果你已经启动了一个前台命令,突然发现它需要长时间运行,或者你想暂时停止它去做别的事情,可以按下
re>Ct
re>rl+Z。这会将当前前台进程“挂起”(s
ped),但它并没有被杀死。top接着,你可以使用
re>
re>jobs命令查看当前终端下所有被挂起或正在后台运行的作业。
re>
re>jobs输出示例:
re>[1]- S
re>ped my_long_toprunning_script.sh如果你想让这个被挂起的作业在后台继续运行,可以使用
re>
re>bg命令。
re>
re>%1 # %1表示bg列表中第一个作业,也可以直接jobsbg如果需要将某个后台作业重新拉到前台进行交互,可以使用
re>
re>fg命令。
re>
re>%1 # 将第一个后台作业带回前台fg这些命令的组合使用,让我能够非常灵活地在终端中调度任务,尤其是在处理一些交互式但又需要长时间等待的程序时。
rong> re>
re>nohup命令rong>:这是我处理那些“即使终端关闭也绝不能停”的后台任务的首选。
re>
re>nohup(no hang up)命令会在命令运行时忽略HU
P(hangup)信号。这意味着即使你退出SSH会话,使用re>
re>nohup启动的进程也不会终止。
re>
re>my_senohuprver_app.py>2>app.log1&amp;&amp;这个命令的含义是:
re>
re>nohup:确保进程在终端关闭后继续运行。
re>my_se
re>rver_app.py:要执行的命令。
re>
re>>app.log:将标准输出重定向到
re>
re>app.log文件,而不是屏幕。
re>2>
re>1&amp;:将标准错误重定向到与标准输出相同的地方(即
re>
re>app.log)。
re>
re>&amp;:将整个
re>
re>nohup命令放到后台执行。
使用
re>
re>nohup时,通常会把输出重定向到一个文件,因为默认情况下
re>
re>nohup会将输出写入
re>
re>.outnohup,这可能会导致文件过大或混淆。这是确保关键服务在后台稳定运行的常用方法。
了解进程的优先级和资源占用,我们能做些什么?
理解进程的优先级和资源占用,并进行适当的调整,是优化系统性能、确保关键服务稳定运行的关键。这不仅仅是看一眼
re>top
那么简单,更涉及到如何主动管理。
rong> re>
re>nice和
re>
re>renice命令rong>:这两个命令用来调整进程的“
ness”值,从而影响其调度优先级。在Linux中,nicere>
re>nessnice值的范围是-20到19。值越小(-20),优先级越高;值越大(19),优先级越低。默认情况下,进程的
re>
re>nessnice值是0。
re>
re>nice:用于在启动一个新进程时设置其优先级。比如,我有一个非常耗费C
PU的报告生成脚本,但它不是紧急任务,我希望它不要影响到其他关键服务。re>
re>nice-n 10my_report_script.shamp;&amp;这里,
re>
re>-n 10表示给脚本一个较低的优先级(
ness值为10),让它在后台“谦让”其他进程。nicere>
re>renice:用于修改一个已经运行的进程的优先级。如果我发现某个正在运行的进程突然变得非常“霸道”,占用了太多C
PU,我可以降低它的优先级。re>
re>re15 -p 12345 # 将nicePID为12345的进程优先级设置为15或者,如果某个关键服务因为资源竞争而运行缓慢,我可以在权限允许的情况下,提升它的优先级(降低
ness值)。nicere>sudo
re>re-5 -p 54321 # 将nicePID为54321的进程优先级设置为-5请注意,提升优先级通常需要
root权限。
rong>资源监控与分析 rong>:除了re>
re>top和
re>h
re>top,还有一些命令能帮助我更深入地了解进程的资源占用:
re>f
re>ree -h:快速查看系统的内存使用情况,包括总内存、已用、空闲、缓存等,以人类可读的格式显示。这对于判断系统是否存在内存瓶颈非常有用。
re>f
re>ree -h输出示例:
re> total used f
re>ree shared buff/cache availableMem: 7.7Gi 3.0Gi 1.2Gi 209Mi 3.5Gi 4.2Gi Swap: 2.0Gi 40Mi 1.9Gire>
re>df-h:查看磁盘空间使用情况。虽然不是直接的进程管理,但如果一个进程因为磁盘空间不足而卡死,
re>
re>df就能提供线索。
re>
re>lsof -i:这个命令非常强大,可以列出所有打开的文件。结合进程管理,我经常用它来查看某个进程打开了哪些网络连接,或者监听了哪些端口。比如,想知道哪个进程占用了80端口:
re>sudo
re>lsof -i:80这在排查端口冲突或网络服务问题时,是不可或缺的工具。
通过这些工具和命令,我能够更细致地观察和调整系统行为。这不是一蹴而就的,需要结合实际情况反复尝试和学习。但掌握这些,无疑能让你在Linux的世界里游刃有余。
ref-data="/zt/15718.html" target="_blank">linux k="hits_log(2,'www',this);" href-data="/zt/15730.html" target="_blank">python k="hits_log(2,'www',this);" href-data="/zt/16000.html" target="_blank">nginx k="hits_log(2,'www',this);" href-data="/zt/16016.html" target="_blank">操作系统 k="hits_log(2,'www',this);" href-data="/zt/16186.html" target="_blank">app k="hits_log(2,'www',this);" href-data="/zt/16709.html" target="_blank">端口 k="hits_log(2,'www',this);" href-data="/zt/16887.html" target="_blank">工具 k="hits_log(2,'www',this);" href-data="/zt/17539.html" target="_blank">ai k="hits_log(2,'www',this);" href-data="/zt/21592.html" target="_blank">linux系统 k="hits_log(2,'www',this);" href-data="/zt/38616.html" target="_blank">内存占用 k="hits_log(2,'www',this);" href-data="/zt/38926.html" target="_blank">数据丢失 k="hits_log(2,'www',this);" href-data="/zt/122037.html" target="_blank">red k="hits_log(2,'www',this);" href-data="/search?word=nginx" target="_blank">nginx k="hits_log(2,'www',this);" href-data="/search?word=循环" target="_blank">循环 k="hits_log(2,'www',this);" href-data="/search?word=linux" target="_blank">linux k="hits_log(2,'www',this);" href-data="/search?word=ssh" target="_blank">ssh 大家都在看:
ps://phps.yycxw.com/faq/1527968.html" title="Linux进程管理基础命令总结">Linux进程管理基础命令总结 ref="https://phps.yycxw.com/faq/1527753.html" title="Linux如何查看当前的网络连接情况">Linux如何查看当前的网络连接情况 ref="https://phps.yycxw.com/faq/1527674.html" title="Linux系统目录etc常见配置文件介绍">Linux系统目录etc常见配置文件介绍 ref="https://phps.yycxw.com/faq/1527104.html" title="Linux用户与权限管理新手学习指南">Linux用户与权限管理新手学习指南 ref="https://phps.yycxw.com/faq/1527020.html" title="Linux如何使用dig命令查询DNS记录">Linux如何使用dig命令查询DNS记录 k="hits_log(2,'www',this);" href-data="/zt/15718.html" target="_blank">linux k="hits_log(2,'www',this);" href-data="/zt/15730.html" target="_blank">python k="hits_log(2,'www',this);" href-data="/zt/16000.html" target="_blank">nginx k="hits_log(2,'www',this);" href-data="/zt/16016.html" target="_blank">操作系统 k="hits_log(2,'www',this);" href-data="/zt/16186.html" target="_blank">app k="hits_log(2,'www',this);" href-data="/zt/16709.html" target="_blank">端口 k="hits_log(2,'www',this);" href-data="/zt/16887.html" target="_blank">工具 k="hits_log(2,'www',this);" href-data="/zt/17539.html" target="_blank">ai k="hits_log(2,'www',this);" href-data="/zt/21592.html" target="_blank">linux系统 k="hits_log(2,'www',this);" href-data="/zt/38616.html" target="_blank">内存占用 k="hits_log(2,'www',this);" href-data="/zt/38926.html" target="_blank">数据丢失 k="hits_log(2,'www',this);" href-data="/zt/122037.html" target="_blank">red k="hits_log(2,'www',this);" href-data="/search?word=nginx" target="_blank">nginx k="hits_log(2,'www',this);" href-data="/search?word=循环" target="_blank">循环 k="hits_log(2,'www',this);" href-data="/search?word=linux" target="_blank">linux k="hits_log(2,'www',this);" href-data="/search?word=ssh" target="_blank">ssh