位图通过位操作用少量内存高效标记大量整数状态,核心是使用std::vector<unsigned int>按位存储,每个bit表示一个整数的存在与否,支持快速的set、clear、get操作,并可扩展优化如64位块、popcount统计等,适用于去重、排序、资源管理等场景。

在c++中实现一个位图(Bitmap),核心是用少量内存高效标记大量整数状态,比如记录某个整数是否出现过、某个资源是否被占用等。通过位操作直接管理二进制位,可以将空间消耗降低到传统布尔数组的1/8甚至更少。
基本原理与设计思路
位图本质是一个大数组,每个比特(bit)代表一个数据项的状态:0表示未标记,1表示已标记。假设要管理从0到N-1的整数,就需要至少N个bit的空间。
例如,管理0~31的整数,只需要一个unsigned int(通常32位)即可;管理0~9999,则需要约10000 / 32 ≈ 313个unsigned int。
关键点:
- 使用std::vector<unsigned int>或裸指针管理位存储块
- 通过位运算实现单个bit的设置、清除、查询
- 支持快速清零、填充、遍历等操作
位操作基础:如何定位和修改某一位
给定一个整数index,找出它在哪个整型单元中,以及在该单元中的第几位。
立即学习“C++免费学习笔记(深入)”;
- 所在块索引: index / 32 或等价于 index >> 5
- 位偏移: index % 32 或等价于 index & 0x1F
- 设置位: bits[block] |= (1U << offset)
- 清除位: bits[block] &= ~(1U << offset)
- 查询位: (bits[block] >> offset) & 1
这些位运算非常高效,编译器通常会优化成CPU原生指令。
简易位图类实现示例
下面是一个轻量级、可复用的Bitmap实现:
class Bitmap { private: std::vector<unsigned int> data; int size; // 总共管理多少位 public: explicit Bitmap(int n) : size(n) { data.resize((n + 31) / 32, 0); } void set(int index) { if (index < 0 || index >= size) return; int block = index >> 5; int offset = index & 0x1F; data[block] |= (1U << offset); } void clear(int index) { if (index < 0 || index >= size) return; int block = index >> 5; int offset = index & 0x1F; data[block] &= ~(1U << offset); } bool get(int index) const { if (index < 0 || index >= size) return false; int block = index >> 5; int offset = index & 0x1F; return (data[block] >> offset) & 1; } void reset() { std::fill(data.begin(), data.end(), 0); } };
这个实现简洁且高效,适合嵌入式、算法题或高性能场景。
应用场景与优化建议
位图常见用途包括:
- 去重统计:如布隆过滤器底层结构
- 内存分配器:标记页是否空闲
- 排序加速:对小范围整数进行O(n)排序(计数排序变种)
- 状态标记:任务调度中标记任务完成状态
优化方向:
- 使用uint64_t代替unsigned int提升吞吐(64位系统)
- 添加count()方法,用__builtin_popcount加速统计1的数量
- 支持原子操作版本用于多线程环境
- 动态扩容(类似std::vector)以支持不确定范围
基本上就这些。位图结合位操作,是C++中实现高效数据标记的经典手段,简单但威力强大。


