c++如何使用std::search_c++在容器中查找子序列【详解】

3次阅读

std::search可在vector中查找子序列,需确保元素可比较、迭代器为前向迭代器,空子序列需特殊处理,返回vec.end()表示未找到;支持自定义谓词实现大小写不敏感查找;与std::find_end区别在于前者找首次、后者找末次出现。

c++如何使用std::search_c++在容器中查找子序列【详解】

std::search 在 vector 中查找子序列的正确用法

直接用 std::search 查找子序列是可行的,但必须确保两个容器元素类型可比较、迭代器满足前向迭代器要求(vectorStringArray 都满足)。它不支持 listforward_list 的随机访问优化,但依然能工作——只是退化为逐个比对。

常见错误是传入空子序列:当子序列为空时,std::search 返回第一个迭代器(即搜索范围起始),这符合标准但容易引发越界读取(比如后续做 *it 解引用)。

  • 始终检查子序列是否为空:if (subseq.empty()) return vec.begin();
  • 使用时注意返回值:找不到返回 vec.end(),不是 nullptr,别用 == nullptr 判断
  • 子序列长度不能超过主容器,否则结果未定义(实际通常返回 end(),但不保证)
vector<int> vec = {1, 2, 3, 4, 2, 3, 5}; vector<int> sub = {2, 3}; auto it = search(vec.begin(), vec.end(), sub.begin(), sub.end()); if (it != vec.end()) {     cout << "found at index " << (it - vec.begin()) << "n"; // 输出 1 }

自定义比较函数让 std::search 支持 case-insensitive 字符串查找

默认 std::searchoperator==,对 string 是区分大小写的。要忽略大小写,必须传入第 5 个参数——一个二元谓词函数对象

注意:这个谓词接收的是**解引用后的元素值**,不是迭代器;对 string 就是 char,不是 string::value_type*

立即学习C++免费学习笔记(深入)”;

  • 不能用 std::toupper 直接传参,它接受 int,且需处理 EOF;应先转为 unsigned char 再投给 toupper
  • lambda 最简写法:[](char a, char b) { return toupper((unsigned char)a) == toupper((unsigned char)b); }
  • 若用 std::stringc_str() + strstr,就绕过了 std::search,不属于本接口范畴
string text = "Hello World"; string pat = "HEL"; auto it = search(text.begin(), text.end(),                  pat.begin(), pat.end(),                  [](char a, char b) {                      return toupper((unsigned char)a) == toupper((unsigned char)b);                  }); // it 指向 'H',而非失败

std::search 和 std::find_end 的关键区别在哪

两者都找子序列,但语义不同:std::search 找**第一次出现**,std::find_end 找**最后一次出现**。名字里的 “end” 容易误解为“末尾”,其实是 “find the last occurrence” 的缩写。

性能上无本质差异,都是 O(n×m) 最坏复杂度;但若你本意是找最后一次却用了 search,逻辑就错了。

  • 查找日志中最后一次错误:用 find_end,不是 search
  • 查找模板代码中首个 template<typename t></typename>:用 search
  • 两者都不支持重叠匹配(如在 "aaaa" 中找 "aa",只报告索引 0 和 2,不会报 1)

在 std::deque 或 std::array 中使用 std::search 的注意事项

deque 支持随机访问迭代器,std::search 可以正常使用,但内部算法仍按前向迭代器路径走(因为标准没要求它利用随机访问加速)。实际表现和 vector 几乎一致。

array 是聚合类型,std::search 对它完全友好,但要注意:若用 std::array<t n>::data()</t> 得到裸指针,传给 search 时必须配对使用 data() + size(),不能传 &arr[0]&arr[N]——虽然等价,但可读性差且易错。

  • array<int> a = {1,2,3,2,3}; search(a.begin(), a.end(), sub.begin(), sub.end());</int> ✅ 推荐
  • search(a.data(), a.data()+a.size(), ...) ✅ 合法但冗余
  • deque,避免反复调用 begin()/end()循环里——它们不是 O(1) 常量时间(尽管现代实现通常是)

真正容易被忽略的是:所有容器的 value_type 必须支持复制构造(或移动),且比较操作不能抛异常——否则 std::search 行为未定义。例如含 std::mutex 成员的类,放进 vector 后调用 search 就会崩溃。

text=ZqhQzanResources