监控配置热更新需四层保障:轮询std::Filesystem::last_write_time检测变更;用std::shared_ptr+原子指针实现安全切换;解析隔离于独立作用域且选无状态库;sigusr1作信号兜底。

用 std::filesystem::last_write_time 监控配置文件变更
热更新的前提是知道配置变了。轮询是最直接、跨平台、不依赖外部库的方式,std::filesystem::last_write_time 是 c++17 提供的可靠接口,比自己调用系统 API 更安全。
常见错误是只读一次时间戳就不管了——必须在业务循环或独立线程里定期检查。注意:windows 上 FAT32 卷的时间精度只有 2 秒,NTFS 是 100ns;linux ext4 默认是纳秒级,但某些挂载选项(如 noatime)不影响 mtime,可放心用。
- 每次检查前先用
std::filesystem::exists确认文件还在,避免因编辑器临时替换文件(如 vim 写入时先删后建)导致路径失效 - 不要用
std::this_thread::sleep_for(100ms)这种固定间隔——太频繁伤性能,太长有延迟;建议 500ms~2s,视配置敏感度调整 - 时间比较别直接比
==,用std::abs((new_time - old_time).count()) > 0防止浮点/时钟精度导致误判
解析新配置时避免 std::shared_ptr 引用悬挂
热更新不是“改完立刻切”,而是“解析成功后再原子切换”。很多实现卡在这里:旧配置对象还在被 worker 线程引用,新解析却直接 delete 或覆盖了底层内存。
典型场景是全局配置指针(如 g_config)被多线程读取。直接赋值 g_config = parse_config(...) 不安全——worker 可能刚读到指针,下一帧你就把它 free 了。
立即学习“C++免费学习笔记(深入)”;
- 用
std::shared_ptr<const config></const>存储配置,所有读取方持有一个副本,写入方只负责构造新实例并原子替换指针 - 替换必须用
std::atomic_store(配合std::atomic<:shared_ptr config>></:shared_ptr>),不能裸指针 +memory_order_relaxed - 解析失败时,保留旧
shared_ptr,日志报错但不停服——这是热更新的基本容错底线
YAML/json 解析库选型对热更新的影响
不是所有解析库都适合热更新场景。核心约束是:解析过程不能持有全局锁、不能泄漏资源、不能在异常时破坏已有状态。
yaml-cpp 默认是单例+全局注册表,多次调用 LoadFile 可能触发静态初始化竞争;nlohmann/json 更轻量,但若用 json::parse 读大文件且没设 max_size,OOM 会导致整个服务卡死。
- 优先选无状态、无全局缓存的库:
simdjson(需提前 reserve buffer)、rapidjson的Document模式(栈分配 +Parse不抛异常) - 永远在独立作用域解析:
auto new_cfg = std::make_shared<Config>();<br>if (auto doc = rapidjson::Document{}; doc.Parse(buf).HasParseError() == false) { /* fill new_cfg */ },确保异常不污染外层
- 禁止在解析函数里做 I/O、网络调用、或访问其他可能热更新的模块——配置解析必须是纯内存操作
信号处理(SIGUSR1)作为手动触发 fallback
文件监控会漏掉某些情况:NFS 缓存延迟、容器内文件系统事件丢失、编辑器未触发 mtime 更新(如 sed -i 原地修改)。这时需要人工干预通道。
unix-like 系统用 SIGUSR1 是事实标准,Windows 用 SetConsoleCtrlHandler 捕获 Ctrl+C 也可类比,但别用 SIGTERM——那是关机信号,语义冲突。
- 信号处理函数里只做标记(如原子 bool
g_need_reload = true),绝不调用printf、malloc、或任何非 async-signal-safe 函数 - 主循环里检查该标记,再走完整 reload 流程——和文件监控走同一套逻辑,保证行为一致
- 务必在程序启动时用
sigprocmask或pthread_sigmask把SIGUSR1block 住,只在主循环线程 unblock,避免多线程争抢
热更新真正的复杂点不在“怎么读新文件”,而在于“怎么让所有正在跑的逻辑都看到同一个版本,且不互相踩脚”。时间戳、智能指针、解析隔离、信号兜底——这四层缺一不可,少一层就容易出现配置部分生效、线程看到新旧混搭、或者某次 reload 后服务变诡异状态。