c++中如何避免std::shared_ptr的性能开销？ (原子引用计数)

14次阅读

std::shared_ptr原子引用计数拖慢性能是因为即使单线程下也无法省略原子指令，导致内存屏障、优化受限及缓存一致性开销；实测tight loop中性能比裸指针低3–5倍。

为什么 std::shared_ptr 的原子引用计数会拖慢性能？

std::shared_ptr 默认使用原子操作（如 std::atomic_fetch_add）管理引用计数，确保多线程环境下安全。但即使在单线程场景下，编译器也无法省略这些原子指令——它们会强制内存屏障、禁用部分优化，并可能触发锁总线或缓存一致性协议开销。实测中，在 tight loop 里频繁拷贝/析构 std::shared_ptr，性能可能比裸指针低 3–5 倍。

如何关闭原子性：用 std::make_shared 配合自定义删除器？

不能直接“关掉”原子性——std::shared_ptr 标准规定其控制块的引用计数必须是线程安全的。但你可以绕过默认控制块，用 std::shared_ptr 的别名构造 + 自定义删除器来避免原子操作：

struct NonAtomicDeleter {     void operator()(int* p) const noexcept {         delete p;     } }; // 构造时不经过标准控制块，引用计数不启用原子操作 auto ptr = std::shared_ptr(new int(42), NonAtomicDeleter{});

注意：std::make_shared 无法用于此场景，因为它总会分配带原子计数的控制块；必须用原始指针 + 自定义删除器构造。

该方式仅适用于明确单线程上下文，且你完全掌控所有 shared_ptr 实例的生命周期
不能与通过 std::make_shared 创建的同对象 shared_ptr 混用，否则控制块不一致，导致未定义行为
拷贝该 shared_ptr 仍会调用原子操作——因为 shared_ptr 的拷贝赋值/构造函数内部仍会访问控制块的引用计数

更实际的替代方案：std::unique_ptr 或裸指针 + 明确所有权

若不需要共享语义，std::shared_ptr 本身就是误用。性能问题只是表象，根源在于设计阶段没厘清所有权：

立即学习“C++免费学习笔记（深入）”；

用 std::unique_ptr 替代：零运行时开销，移动语义清晰，且能配合 std::move 和 std::make_unique
若需跨函数传递只读访问，优先传 const T& 或 T*，而非 std::shared_ptr
若确实要共享，但只在单线程内传播（如配置树、AST 节点），可封装一个非原子版 shared_ptr（如 Boost 的 boost::local_shared_ptr），它用普通整型计数，不依赖原子指令

何时必须接受原子开销？

只要出现以下任一情况，就无法规避原子引用计数：

多个线程同时拷贝、赋值或销毁指向同一对象的 std::shared_ptr
使用 std::weak_ptr —— 它依赖同一控制块中的原子弱引用计数
通过 std::shared_ptr::owner_before 或比较操作做排序，因为实现依赖控制块地址和原子状态
将 std::shared_ptr 存入 std::vector 并频繁 resize —— 每次元素移动都触发引用计数增减

真正难处理的不是原子操作本身，而是人们把 std::shared_ptr 当作“不用动脑的所有权解决方案”，结果在 hot path 上反复构造/拷贝，却没意识到大部分时候只需要移动或引用。

发表于：开发工具

2026-01-10

复制链接

VSCode的Output Colorizer：让终端输出信息高亮显示

Go语言结构体初始化中混合使用字段名-值和纯值语法的限制与解决方案

VSCode 的终端输出如何实现高级过滤与搜索？

composer require dev和require的区别_composer require与require-dev的用途差异详解

c# async void 和 async Task 的区别为什么说要避免async void

c++中如何避免std::shared_ptr的性能开销？ (原子引用计数)

为什么 std::shared_ptr 的原子引用计数会拖慢性能？

如何关闭原子性：用 std::make_shared 配合自定义删除器？

更实际的替代方案：std::unique_ptr 或裸指针 + 明确所有权

何时必须接受原子开销？

计算两个事件序列在每日时间粒度上的重叠时长（秒）

php调用听书插件怎样切换朗读音色_php切换听书音色操作步骤【技巧】

C# 反射使用方法 C#如何通过反射获取类型信息

c# 用户态和内核态的切换对c#并发性能的影响

javascript如何存储数据_localstorage和sessionstorage有何区别【教程】

GitPython 中高效获取当前分支相对于 master 的所有变更文件列表

如何在 React.js 中使用 @ 符号进行路径别名导入

Sublime怎么设置代码缩进为2个空格_Sublime前端开发缩进规范【指南】

css如何通过float和clear控制元素排列_解决浮动元素排列问题

如何优化Golang程序的日志输出性能_Golang日志优化与并发写入技巧