当服务器温度过高时,可通过脚本结合logrotate实现日志切割。首先配置logrotate规则并编写监控脚本,使用sensors或/sys接口获取CPU温度,超过阈值则触发logrotate -f执行日志分割,配合cron定时检查,适用于高温告警等场景,提升系统可观测性。

linux系统中日志文件会随着时间不断增长,容易占用大量磁盘空间。常见的解决方案是使用logrotate进行自动管理。但默认情况下,logrotate按时间或文件大小切割日志。如果想根据硬件温度等自定义条件触发日志切割,比如在服务器温度过高时保留当前运行状态日志并分割存档,就需要结合脚本与logrotate实现特殊逻辑。
理解logrotate的基本机制
logrotate是Linux下用于管理日志文件的工具,通常由cron每日调用执行。它的配置文件位于/etc/logrotate.conf,具体服务的日志规则放在/etc/logrotate.d/目录下。
标准配置示例如下:
/etc/logrotate.d/myapp
上述配置表示每天检查一次日志,最多保留7个归档文件,并启用压缩。
如何根据硬件温度触发日志切割
要实现“当CPU或硬盘温度超过阈值时立即切割日志”,需借助外部监控脚本主动调用logrotate,而不是依赖定时任务。
步骤如下:
- 读取硬件温度:使用sensors命令(来自lm-sensors包)获取当前温度数据
- 编写判断脚本:检测温度是否超标
- 触发logrotate:调用logrotate命令强制执行特定配置
先确保安装必要工具:
yum install lm_sensors logrotate -y 或 apt-get install sensors logrotate -y
编写温度监控与日志切割脚本
创建脚本/usr/local/bin/temp_log_rotate.sh:
#!/bin/bash <p>LOG_FILE="/var/log/high_temp.log" TEMP_THRESHOLD=75 # 温度阈值,单位摄氏度 ROTATE_CONF="/etc/logrotate.d/hightemp"</p><h1>获取最高CPU温度</h1><p>CURRENT_TEMP=$(sensors | grep "Core" | awk '{print $3}' | tr -d '+' | cut -d"." -f1 | sort -nr | head -1)</p><p>if [ -z "$CURRENT_TEMP" ]; then CURRENT_TEMP=$(cat /sys/class/thermal/thermal_zone*/temp 2>/dev/null | awk '{print int($1/1000)}' | sort -nr | head -1) fi</p><p>if [ -z "$CURRENT_TEMP" ]; then exit 0 fi</p><p>if [ "$CURRENT_TEMP" -ge "$TEMP_THRESHOLD" ]; then echo "$(date): Temperature $CURRENT_TEMP°C exceeds threshold. Rotating logs." >> $LOG_FILE /usr/sbin/logrotate -f $ROTATE_CONF fi</p>
该脚本优先使用sensors命令,若不可用则尝试从/sys接口读取温度。
配置logrotate策略:
/etc/logrotate.d/hightemp
/var/log/myapp.log { copytruncate rotate 5 missingok notifempty }
注意使用copytruncate:它复制日志后清空原文件,避免重启服务。适合无法停写日志的应用。
将脚本加入定时任务(如每5分钟检查一次):
crontab -e
添加行:
*/5 * * * * /usr/local/bin/temp_log_rotate.sh
实际应用场景与注意事项
这种方案适用于高温告警、性能异常记录等场景。例如,在边缘计算设备或无空调机房中,温度突增可能预示散热故障,及时切割日志有助于事后分析问题发生前的状态。
几点提醒:
- 确保脚本有足够权限读取温度和操作日志文件
- 频繁调用logrotate可能导致日志碎片化,建议结合时间窗口控制频率
- 可扩展脚本,发送邮件或写入系统日志通知管理员
- 测试阶段可在脚本中加入调试输出,确认逻辑正确
基本上就这些。通过灵活组合shell脚本与logrotate,可以轻松实现基于硬件状态的日志管理策略,提升系统可观测性。