c++的Type Erasure (类型擦除)技术是什么? (std::function的实现)

4次阅读

std::function通过虚函数表实现类型擦除,将invoke、copy、destroy等操作抽象为基类接口,派生类按具体类型实现,配合小对象优化减少分配。

c++的Type Erasure (类型擦除)技术是什么? (std::function的实现)

std::function 是怎么做到“擦掉”具体类型的?

它不存储原始函数对象,而是把调用逻辑和数据打包进一个统一的基类接口里,运行时通过虚函数跳转。关键不是“丢掉类型”,而是把类型行为抽象成 invokecopydestroy 这几个固定操作。

典型结构是:std::function 内部持有一个指向基类(比如 std::function_base 或类似)的指针,所有可调用对象(Lambda、函数指针、绑定对象)在构造时被包装进对应的派生类实例,并存入堆内存(或小对象优化缓冲区)。

  • 每次赋值或构造 std::function,都会触发一次类型专属的包装:生成一个继承自统一基类的临时派生类,重写虚函数实现该类型的调用/拷贝/析构逻辑
  • 调用 operator() 时,实际走的是基类虚函数表里的 invoke 入口,由派生类实现具体转发
  • 小对象优化(SOO)会让短 lambda 或简单函数指针直接存在 std::function 对象内部,避免堆分配——但虚函数调用机制不变

自己手写一个极简 Type Erasure 包装器要注意什么?

核心是定义清晰的接口基类,且所有操作必须能通过虚函数完成。不能依赖模板参数在运行时还“可见”。

struct callable_base {     virtual ~callable_base() = default;     virtual void invoke(int) = 0;     virtual callable_base* clone() const = 0; // 拷贝必须返回基类指针 }; 

template struct callable_model : callablebase { F f; callablemodel(F f) : f(std::move(f)) {} void invoke(int x) override { f_(x); } callable_base* clone() const override { return new callablemodel(f); } };

  • 基类析构函数必须是 virtual,否则 delete 派生对象会未定义行为
  • clone() 返回 callable_base*,不是 auto 或模板类型,否则无法统一管理
  • 不能在基类里存模板成员变量;所有类型相关数据都得塞进派生类,基类只留虚函数指针
  • 若支持移动语义,还需补充 move_construct 接口,否则 std::function 移动后原对象仍可能被误调用

为什么 std::function 的拷贝开销可能比预期大?

每次拷贝 std::function,默认会触发底层可调用对象的深拷贝(via clone()),哪怕那个对象本身是轻量级的(如捕获空的 lambda)。这不是 bug,是类型擦除的设计代价。

立即学习C++免费学习笔记(深入)”;

  • 函数对象若捕获了大块数据(如 std::vectorstd::String),拷贝就会变慢
  • 即使启用 SOO,超出缓冲大小仍会堆分配,拷贝即堆内存复制 + 构造新对象
  • 某些编译器对空 lambda 的 clone 做了优化,但不可依赖;真实项目中应避免频繁拷贝 std::function
  • 若只需传递不可变调用体,优先用 const std::function& 或直接传模板参数(template

std::function 的类型擦除和 void* + 函数指针有什么本质区别

区别在于安全性和扩展性。void* 方案靠程序员手动维护类型信息和调用约定,而 std::function 把类型契约封装进虚函数表,编译器保证调用安全。

  • void* 无法自动处理移动/拷贝/析构,容易内存泄漏或二次析构
  • 虚函数方案天然支持多态行为:比如你可以加 target_type() 返回 std::type_info,而 void* 没法知道原始类型
  • 虚函数表带来一点间接跳转开销,但换来的是 RaiI 安全和标准兼容性;void* 看似快,实则错误成本高得多
  • 现代 std::function 实现(如 libstdc++、libc++)已对常见情况(函数指针、无捕获 lambda)做特化,性能差距远小于教科书描述

类型擦除真正的复杂点不在“怎么擦”,而在“擦完之后怎么安全地还原行为”。虚函数只是手段,契约一致才是关键。漏掉任何一个生命周期操作(尤其是 destroy),就可能在 move/copy/析构时崩溃。

text=ZqhQzanResources