std::sort自定义比较需传Lambda或函数指针,参数须const&、返回bool且严格弱序;重载operator

std::sort 传自定义比较函数时必须是可调用对象
结构体默认没定义 ,直接 <code>std::sort 会编译失败,报错类似:invalid operands to binary expression ('const Person' and 'const Person')。不是语法写错了,是编译器根本不知道怎么比。
最稳妥的做法是传一个 lambda 或普通函数指针,要求两个参数、返回 bool,且不能修改参数(得加 const &):
std::sort(vec.begin(), vec.end(), [](const Person& a, const Person& b) { return a.age < b.age; // 升序:小的在前 });
- lambda 捕获列表必须为空(
[ ]),带捕获的 lambda 不能隐式转成函数指针,而std::sort内部可能做类型擦除或优化,依赖可转换性 - 如果用独立函数,记得声明为
bool cmp(const Person&, const Person&),不能漏const和引用,否则临时对象构造开销大,还可能绑定失败 - 别写成
return a.age ——相等时返回 <code>true会破坏严格弱序,导致未定义行为,程序可能崩溃或结果乱序
结构体内重载 operator 后能直接用 <code>std::sort
如果你控制结构体定义,且这个“自然顺序”固定(比如总按 id 排),重载 operator 最省事,之后所有容器排序都无需额外传比较逻辑。
struct Person { int id; std::String name; int age; bool operator<(const Person& other) const { return id < other.id; } };
- 必须加
const成员函数修饰,否则std::sort传入的 const 引用无法调用它 - 只重载
operator 就够了,<code>std::sort不关心==或> - 如果后续需要多种排序方式(比如有时按年龄、有时按姓名),硬编码
operator 反而碍事,这时候还是用 lambda 更灵活
用 std::stable_sort 保持相等元素的原始顺序
当结构体字段有重复值(比如多人同龄),又希望“先输入的排前面”,就得换 std::stable_sort。它比 std::sort 稍慢,但保证稳定性。
立即学习“C++免费学习笔记(深入)”;
常见场景:日志按时间戳排序,但同一秒内多条日志要维持采集顺序;或分页数据合并后去重再排序,需保留原始插入位置关系。
- 稳定性不等于“结果确定”,而是指:若
a和b比较结果为相等(即!cmp(a,b) && !cmp(b,a)),则排序后a在b前的相对位置不变 - 不要以为加个
return a.age 就能模拟稳定——这是错的,会破坏算法前提,结果不可预测 -
std::stable_sort对随机访问迭代器(如vector)是 O(n log²n),空间复杂度略高,大数据量时注意内存
结构体含指针或非 trivial 成员时,排序本身不触发深拷贝问题
std::sort 移动的是结构体对象本身,不是靠拷贝构造——只要结构体支持移动(默认生成的移动构造函数可用),就只搬内存位,不调用构造/析构。这点常被误解。
例如结构体里有 std::string 或 std::vector,它们内部是堆内存指针,std::sort 交换时只是交换这些指针值,不 new/delete,所以安全高效。
- 唯一要注意的是:确保结构体没有用户自定义的、非 noexcept 的移动构造函数,否则
std::sort可能退化为拷贝(c++11 起标准要求移动操作最好是 noexcept) - 如果结构体含裸指针(如
int*)且手动管理内存,排序后指针值还在,但指向内容没变——这本身没问题;出问题往往是后续误以为指针随对象“一起迁移”了,其实只是地址被复制了 - 别为了“避免拷贝”把结构体改成存
std::shared_ptr<person></person>再排序——多一层间接,缓存不友好,纯属过度设计
实际写的时候,90% 的情况用 lambda 最直白;真要复用比较逻辑,抽成命名函数比重载 operator 更可控;稳定性需求不常有,但一旦有,别硬凑 <code>std::sort 加时间戳字段来 hack。