c++如何判断数组中是否有重复元素_c++使用set查重【技巧】

3次阅读

用std::unordered_set判断重复最高效,平均O(1)插入,内置类型无需额外配置;std::set次之,O(log n);排序扫描O(n log n)但省空间;避免O(n²)的count或嵌套循环

c++如何判断数组中是否有重复元素_c++使用set查重【技巧】

std::set 判断数组是否有重复元素最简单

直接把所有元素插入 std::set,利用其自动去重特性:插入时如果元素已存在,insert() 返回的 pair::firstfalse,遇到第一个 false 就能立刻返回 true(表示有重复)。

注意别用 std::set::size() 对比原数组长度——这要等全部插入完,浪费时间且无法提前退出。

bool hasDuplicate(const std::vector& arr) {     std::set seen;     for (int x : arr) {         if (!seen.insert(x).second) {             return true; // 插入失败,说明已存在         }     }     return false; }

想更快?改用 std::unordered_set

std::set 是红黑树,单次插入平均 O(log n)std::unordered_set 是哈希表,平均 O(1),整体更优,尤其数据量大时。

但要注意:自定义类型作 key 时,必须提供 hashoperator==;内置类型(如 intstd::String)可直接用。

立即学习C++免费学习笔记(深入)”;

  • 空间换时间:哈希表可能有额外内存开销和哈希冲突
  • 不保证顺序,但查重不需要顺序
  • 最坏情况(大量哈希冲突)退化成 O(n) 插入,但实践中极少发生

原地排序后扫描也能做,但会破坏原始顺序

对数组排序后,相邻相等即说明重复。时间复杂度 O(n log n),空间 O(1)(若允许修改原数组)。

适用场景有限:

  • 输入是可修改的 std::vector,且后续不再需要原始顺序
  • 内存极度受限,连 unordered_set 的哈希桶都扛不住
  • 编译环境不支持 c++11(unordered_set 是 C++11 引入)

示例:

std::vector arr = {/* ... */}; std::sort(arr.begin(), arr.end()); for (size_t i = 1; i < arr.size(); ++i) {     if (arr[i] == arr[i-1]) return true; }

std::count 或遍历嵌套循环?别这么干

std::count 对每个元素都扫一遍数组,复杂度 O(n²);两层 for 也一样。小数组(

常见误写:

// ❌ 错!每次调用 count 都从头扫 for (int x : arr) {     if (std::count(arr.begin(), arr.end(), x) > 1) return true; }

真正要避免的是「没意识到代价」——不是语法错,是算法选择错。

哈希查重的逻辑看似简单,但容易忽略插入返回值的语义,或盲目选 set 而不用 unordered_set;排序法看似省空间,却常被遗忘“是否允许改原数组”这个前提。

text=ZqhQzanResources