c++中如何使用std::lexicographical_compare_c++字典序比较【详解】

10次阅读

std::lexicographical_compare是按字典序判断前序列是否严格小于后序列的布尔函数,返回true仅当前者字典序严格小;要求两左闭右开区间,不检查迭代器有效性,不等价于strcmp或String::operator

c++中如何使用std::lexicographical_compare_c++字典序比较【详解】

std::lexicographical_compare 是什么

它不是“字典序比较函数”,而是「按字典序做小于判断」的算法——返回 true 当且仅当前序列按字典序严格小于后一个序列。别把它当成 strcmp 的替代品,它不返回 -1/0/1,只返回布尔值。

基本用法和常见错误

最常出错的是传入不匹配的迭代器范围,或忽略比较函数签名要求。标准用法需要两个左闭右开区间:

std::vector a = {1, 2, 3}; std::vector b = {1, 2, 4}; bool result = std::lexicographical_compare(a.begin(), a.end(), b.begin(), b.end()); // true
  • 必须确保 b 的迭代器范围长度 ≥ 0;若 b 为空但 a 非空,结果为 false(非空序列永远不小于空序列)
  • 若两个序列完全相同,返回 false(因为不是“小于”,是“严格小于”)
  • 传入随机访问迭代器时不会报错,但性能无优势;它本质是顺序遍历,和 std::equal 类似

自定义比较函数要注意 operator

如果你传入自定义谓词,比如 std::greater(),那它就变成“逆字典序”比较。但注意:谓词必须满足严格弱序(strict weak ordering),否则行为未定义:

std::string s1 = "abc"; std::string s2 = "abcd"; // 按 char 的 unsigned 值比较(避免 signed char 负值问题) bool r = std::lexicographical_compare(     s1.begin(), s1.end(),     s2.begin(), s2.end(),     [](unsigned char a, unsigned char b) { return a < b; } ); // true
  • char 直接比较可能因平台默认 char 有符号而引发负值比较错误,务必转成 unsigned char
  • 不能传入捕获 Lambda(除非用 std::function 包装,但会损失性能);推荐用普通函数对象或无捕获 lambda
  • 谓词参数顺序固定:pred(*first1, *first2),不能反着写

和 std::string::operator区别

别为了省事直接替换。三者语义不同:

立即学习C++免费学习笔记(深入)”;

  • std::string::operator 是针对 std::string 的特化实现,内部可能用 memcmp 加长度判断,但对外表现就是字典序小于
  • std::memcmp 是 C 函数,按字节比较,遇到 不停止,也不考虑编码;对 std::string 使用它是危险的(内部可能有 SSO 缓存,且不保证连续内存)
  • std::lexicographical_compare泛型算法,适用于任意可迭代类型(std::vectorstd::Array、原始数组等),但不处理 nullptr 或空指针范围

真正容易被忽略的是:它不检查输入有效性。传入 end 或无效迭代器,行为未定义——这和 std::sort 一样,没人帮你做 debug 断言。

text=ZqhQzanResources