C++中的类型擦除(Type Erasure)是什么?(std::function的核心实现原理)

11次阅读

类型擦除是通过多态与模板组合实现的隐藏类型惯用法,典型代表是std::function;它用非模板基类声明虚函数,为每种可调用类型F模板实例化派生类callable_impl,内部持有F并实现虚函数,std::function仅保存基类指针或SOO缓冲区,从而抹去具体类型信息。

C++中的类型擦除(Type Erasure)是什么?(std::function的核心实现原理)

类型擦除不是语法特性,而是用多态+模板组合出来的“隐藏类型”的惯用法;std::function 就是它最典型的落地——你传进去一个 Lambda、一个成员函数指针、甚至一个捕获了 std::unique_ptr 的 functor,对外调用接口始终是 f(1, "hello"),完全不暴露内部类型。

为什么不用继承void*?——类型擦除要解决的根本矛盾

直接用基类指针要求所有可调用对象都继承同一接口,不现实;用 void* 又彻底丢失类型安全和析构逻辑。类型擦除走的是中间路线:

  • 定义一个**非模板抽象基类**(比如叫 callable_base),只声明 invoke()clone()~dtor() 这几个虚函数,不涉及任何具体类型
  • 对每个传入的可调用类型 F,**模板实例化一个派生类** callable_impl,它内部持有 F f_,并实现那几个虚函数
  • std::function 对象本身只存一个指向 callable_base 的指针(或 SOO 缓冲区),从此“忘记”F 是什么

std::function 构造时发生了什么?——类型擦除的入口点

关键在构造函数是模板的:template std::function(R(Args...))::function(F&& f)。这一行就完成了擦除的“第一跳”:

  • 编译器为每个 F(比如 auto l = [&]{...};)生成专属的 callable_impl
  • 该派生类在上(或 SOO 区)构造,并把地址赋给基类指针成员
  • 后续所有调用(operator())、拷贝(复制构造)、移动(move 赋值)都通过虚函数分发,不再依赖 F

错误写法示例(常见坑):

struct BadFunctor {     std::unique_ptr p;     void operator()() { /* ... */ } }; std::function f = BadFunctor{}; // OK,因为 std::function 支持 move-only 类型 // 但如果自己手写没处理右值引用,这里就会试图拷贝 unique_ptr → 编译失败

小对象优化(SOO)为什么必须手动管理?——性能敏感点

sizeof(std::function) 通常是 32 字节,不是巧合。它内部有个 union

union {     char small_buffer[32];     void* heap_ptr; }; bool is_small_;

当存储的可调用对象(如无捕获 lambda、普通函数指针)满足 sizeof(F) 且 std::is_trivially_copyable_v 时,就直接 placement-new 到 small_buffer 中。

  • 没手动调 ~F() → 析构不执行,资源泄漏(尤其含 RaiI 成员时)
  • 没按对齐要求分配 small_buffer → 访问违规(alignas 必须显式加)
  • 拷贝 small_buffer 时用了 memcpy 却忽略非 trivial 类型 → 未定义行为

真正难的从来不是“怎么让代码跑起来”,而是“怎么让不同类型在统一接口下各自正确地构造、调用、拷贝、析构、销毁”。std::function 把这套机制封装得足够健壮,但一旦你要自己实现类似功能(比如自定义回调容器),这些细节一个都不能绕开。

立即学习C++免费学习笔记(深入)”;

text=ZqhQzanResources