C++中的std::lower_bound是什么?(如何在有序序列中快速查找)

2次阅读

std::lower_bound返回第一个不小于目标值的迭代器,要求容器升序且支持随机访问;传入未排序数据或错误迭代器将导致未定义行为。

C++中的std::lower_bound是什么?(如何在有序序列中快速查找)

std::lower_bound 用来找“第一个不小于目标值”的位置

它不返回值,而是返回指向满足条件的首个元素的迭代器。用在已排序的容器上,比如 std::vector 或原生数组,时间复杂度是 O(log n),比线性查找快得多。

常见错误是传入未排序的数据——结果完全不可预测,但编译器不会报错,运行时可能返回乱序中的某个位置,甚至越界迭代器。

  • 必须确保区间 [first, last) 是升序排列(默认用 operator 比较)
  • 如果所有元素都小于目标值,返回 last(即越界位置),记得检查是否等于 end()
  • 如果目标值不存在,它仍返回插入位置,这点和二分查找的“下界”定义一致

怎么调用 std::lower_bound?参数顺序和比较函数要注意

最常用的是三参数版本:std::lower_bound(first, last, value)。注意:firstlast 是迭代器,不是下标;last 指向末尾后一位,符合 STL 半开区间惯例。

如果你用自定义类型或想改比较逻辑,得传第四个参数——比如降序查找就得用 std::greater<int>()</int>,否则行为未定义。

立即学习C++免费学习笔记(深入)”;

  • std::vector<int> v = {1,2,2,3,5};</int>std::lower_bound(v.begin(), v.end(), 2) 返回指向第一个 2 的迭代器
  • 若想按绝对值比较,得写 std::lower_bound(v.begin(), v.end(), target, [](int a, int b) { return abs(a)
  • 别把比较函数写成 a ——必须严格弱序,否则 UB(未定义行为)

和 std::upper_bound、std::equal_range 的区别在哪

std::lower_bound 找“第一个 ≥”,std::upper_bound 找“第一个 >”,两者配合就能圈出所有相等元素的范围。而 std::equal_range 就是这两个的组合返回值,一步到位。

性能上没差别,都是两次对数查找;但手写两个 bound 容易漏判边界,尤其当 lower == upper(值不存在)时,直接用 equal_range 更稳。

  • 2{1,2,2,2,3} 中的范围:auto r = std::equal_range(v.begin(), v.end(), 2)r.first 指向首 2r.second 指向末 2 后一位
  • 别用 lower_bound + ++ 来模拟 upper_bound ——遇到重复值会跳过中间部分,结果错
  • 如果只关心存不存在,用 std::binary_search 更语义清晰,也少写几行

在 vector、Array、普通指针数组里都能用,但别在 list 上硬套

std::lower_bound 要求随机访问迭代器,所以 std::vectorstd::array、原生数组指针(如 &arr[0])都没问题;但 std::list 只有双向迭代器,强行传进去会导致 O(n) 时间——它内部会退化成遍历,完全失去二分意义。

如果你的数据在 list 里且频繁查找,要么换容器,要么先把数据拷到 vector 再查。别指望算法自动优化。

  • 对 C 风格数组 int arr[5] = {1,3,5,7,9};,调用方式是 std::lower_bound(arr, arr+5, 6)
  • std::deque 上可用,但缓存局部性差,实际性能可能不如 vector
  • auto it = std::lower_bound(...) 时,确保容器生命周期长于迭代器,别返回局部容器的迭代器

最容易被忽略的是:它不验证输入是否有序,也不检查迭代器有效性。写完别光测“能找到”的 case,一定要加全边界测试——空容器、全相同、目标在头/尾/外、迭代器错位。这些地方一崩就是静默错误。

text=ZqhQzanResources