C# HashSet的用法 – 存储不重复元素的高效集合

8次阅读

HashSet是C#中基于哈希表实现的去重集合,平均时间复杂度O(1),支持Add()添加(重复返回false)、Contains()查找、unionWith()等集合运算,自定义类型需重写GetHashCode()和Equals()或使用record。

C# HashSet的用法 – 存储不重复元素的高效集合

HashSet 是 C# 中专门用于存储不重复元素的集合类型,底层基于哈希表实现,插入、删除、查找平均时间复杂度都是 O(1),比 List 或 Array 做去重快得多。

怎么创建和添加元素

直接 new 一个泛型 HashSet,指定元素类型。添加用 Add() 方法,重复添加会自动忽略,且返回 false

  • var set = new HashSet();
  • set.Add("apple"); // 返回 true
  • set.Add("apple"); // 返回 false,集合不变
  • set.Add("banana"); // 返回 true

判断是否存在或批量初始化

Contains() 判断某个值是否已存在,效率很高。构造时也可以传入已有集合(如数组、List)来快速初始化,自动去重。

  • set.Contains("apple"); // true
  • var numbers = new HashSet(new[] { 1, 2, 2, 3, 3 }); // 结果是 {1, 2, 3}

常用集合操作:交集、并集、差集

HashSet 提供了原生支持的集合运算方法,无需手写循环,代码简洁又高效。

  • set1.UnionWith(set2); // 并集(set1 变成 set1 ∪ set2)
  • set1.intersectWith(set2); // 交集(set1 变成 set1 ∩ set2)
  • set1.ExceptWith(set2); // 差集(set1 变成 set1 - set2)
  • 如果不想修改原集合,可用 Union()Intersect() 等静态扩展方法(需引用 System.linq

注意自定义类型的使用条件

如果存的是自定义类或结构体,必须确保它正确实现了 GetHashCode()Equals(),否则重复判断会失效。推荐用 record 类型,或用 IEqualityComparer 自定义比较逻辑。

  • var people = new HashSet(new PersonComparer());
  • record Person(String Name, int Age); // record 默认按值比较,适合 HashSet

基本上就这些。用 HashSet 存不重复数据,既省心又高效,关键点就是类型要可哈希、操作前想清楚要不要改原集合。

text=ZqhQzanResources