c++怎么使用std-lower-bound_c++二分查找位置【技巧】

2次阅读

std::lower_bound返回首个≥目标值的迭代器,需确保范围升序、检查it!=end()、转下标用it-begin();与upper_bound配合可安全获取重复元素区间;查存在应使用binary_search而非比较结果。

c++怎么使用std-lower-bound_c++二分查找位置【技巧】

std::lower_bound 用法和常见误用

它不返回“是否找到”,而是返回第一个 ≥ 目标值的迭代器位置;用错 std::lower_bound 最常导致越界或逻辑反向——比如把 == 当成查找成功的判断依据。

  • 必须保证输入范围已升序排列,否则行为未定义(不是报错,是结果不可预测)
  • 返回值是迭代器,不是下标:要转下标得写 it - vec.begin(),直接解引用前务必检查 it != vec.end()
  • 如果所有元素都小于目标值,std::lower_bound 返回 vec.end(),此时解引用必崩
std::vector<int> v = {1, 2, 4, 4, 5}; auto it = std::lower_bound(v.begin(), v.end(), 4); int pos = it - v.begin(); // pos == 2,不是 0 或 1

和 std::upper_bound 的关键区别

两者都做二分,但语义不同:std::lower_bound 找“第一个不小于”,std::upper_bound 找“第一个大于”;合起来才能安全框出重复值区间。

  • 对重复元素 {3,4,4,4,5}4lower_bound 指向第一个 4upper_bound 指向 5
  • std::distance(lower, upper) 就是 4 出现次数,比手写循环数快且无边界风险
  • 别用 lower_bound!= 判断“是否存在”——它只管位置,不管相等;真要查存在,用 std::binary_search

自定义比较函数时的陷阱

传入的比较函数必须满足严格弱序,且和排序时用的完全一致;否则 std::lower_bound 可能跳过合法位置或无限循环(极少见但可能)。

  • 升序查就用 std::less{} 或默认;降序查必须用 std::greater{},且原容器也得是降序排好的
  • 自定义结构体时,比较函数参数顺序不能反:bool cmp(const T& a, const T& b) 表示 “a 是否应排在 b 前面”,不是 “a 是否等于 b”
  • Lambda 捕获需谨慎:若 lambda 捕获了局部变量,而迭代器生命周期超出该变量作用域,运行时可能读到垃圾值

性能与替代方案权衡

它时间复杂度稳定 O(log n),但前提是随机访问迭代器(std::vectorstd::Array OK,std::list 不行);对小数组(比如 size

立即学习C++免费学习笔记(深入)”;

  • std::lower_boundstd::vector 是最优选择;对 std::set / std::map,直接用成员函数 lower_bound,它内部是红黑树导航,不走泛型算法路径
  • 编译器无法对泛型 std::lower_bound 做 vectorization,大数据量时若允许预处理,可考虑 std::span + 手写分支预测友好的二分(但极少需要)
  • 调试时别只看返回值,用 std::is_sorted 快速验证输入是否真有序——这是 80% 的“找不到”问题根源

边界检查和比较逻辑一致性,比记住函数名更重要。写完先想清楚:我到底要“定位”还是“判存”,再选对应工具。

text=ZqhQzanResources