c++如何压缩字符串_c++实现简单的运行长度编码【实战】

2次阅读

rle适合大量连续重复字符的字符串压缩，如”aaabbbcccd”→”a3b3c3d1″；对无重复串如”abcdef”反而膨胀。实现要点：单次遍历分段计数、预分配reserve(s.size()*2)、避免to_String频繁分配、数字整批追加。

运行长度编码（RLE）适合什么场景

字符串里有大量连续重复字符时，RLE 才真正省空间。比如 "aaabbbcccd" 压缩成 "a3b3c3d1"，长度从 10 变成 8；但如果是 "abcdef"，压缩后反而是 "a1b1c1d1e1f1"（12 字符），反而更糟。实际用前得先判断重复密度——不是所有字符串都该压。

用 `std::string` 实现 RLE 编码的要点

核心是遍历一次、分段计数，注意边界处理和数字转字符串的开销：

用 size_t i = 0 驱动外层循环，内层用 j 找出当前字符连续长度
避免在循环里反复调用 to_string(count) —— 它分配临时字符串，小字符串高频调用会拖慢速度
提前 reserve 空间：最坏情况是原长两倍（每个字符+单数字），可写 result.reserve(s.size() * 2)
别用 push_back 拼接数字字符，比如 count == 123 时，要一次性追加 "123"，而不是三次 push_back('1') 等

示例关键逻辑：

std::string rle_encode(const std::string& s) {     if (s.empty()) return s;     std::string result;     result.reserve(s.size() * 2);     for (size_t i = 0; i < s.size(); ) {         char c = s[i];         size_t j = i;         while (j < s.size() && s[j] == c) ++j;         size_t count = j - i;         result += c;         result += std::to_string(count); // 这里 to_string 是可接受的，因频次低         i = j;     }     return result; }

解码时容易漏掉的整数解析问题

std::stoi 或 std::stoul 看似方便，但遇到像 "a12b3" 这种输入时，如果只靠 find_first_of("0123456789") 定位数字起始，可能把 "12" 当作一个数；但若手动解析，又得防越界和非数字字符。更稳妥的是边扫边转：

立即学习“C++免费学习笔记（深入）”；

遇到字母，记下 c；紧接着读后续数字字符，累积成 count，直到非数字或到末尾
不要依赖 stoi 的异常机制来控制流程——它抛异常成本高，且 "a12x3" 中的 x 会让 stoi 在 "12x3" 上截断并静默返回 12，掩盖错误
如果输入不可信，必须验证每个数字段是否全由数字构成，且长度合理（比如防超大数导致内存爆炸）

c++ 中 RLE 不该用于通用压缩的真相

RLE 是无损、无状态、零依赖，但它只对特定数据友好。C++ 标准库不提供 RLE，因为：

它不解决通用文本/二进制压缩需求（如 ZIP、LZ4）
对 UTF-8 字符串天然不友好——一个中文字符占 3 字节，s[i] 按字节比较会切开字符，导致乱码和错误计数
没有校验机制：编码后损坏一位（如把 "a3" 变成 "a4"），解码直接崩，而真实压缩格式（如 zlib）带 CRC

真要压缩字符串，优先考虑 zlib 或 lz4 库；RLE 只应在明确知道数据模式（如日志中的重复状态标记、BMP 图像的扫描线）且需手撕轻量方案时出手。

发表于：后端开发

近两天内

复制链接

sftp 连接慢的 TCP window scaling 与 MTU 路径发现

c++怎么解决undefined reference to链接错误_c++链接错误undefined reference排查方法

Go语言如何控制goroutine数量_Golang并发池实现思路

php获取本机ip需root权限吗_php非root取ip法【方案】

怎么测试php代码能否运行_PHP代码简单测试方法【方法】

c++如何压缩字符串_c++实现简单的运行长度编码【实战】

运行长度编码（RLE）适合什么场景

用 `std::string` 实现 RLE 编码的要点

解码时容易漏掉的整数解析问题

c++ 中 RLE 不该用于通用压缩的真相

mysql中解析器与查询执行器的作用与流程

CSS等分比例布局_flex:1在多栏布局中的万能公式

Golang tar与zip标准库怎么用_Golang归档文件操作

为什么VSCode占用内存过高及如何降低消耗【教程】

如何让 HTML 表格四列等宽并保持图片响应式一致

CSS动画简写属性详解_在一个声明中配置所有关键帧参数

Linux 跨机房数据同步的注意事项

如何查询表中数据_mysql select基础操作

sublime如何安装FileDiffs插件_Sublime文件内容对比【插件】

Fastify WebSocket 连接在 HTTPS 下失败的完整解决方案

c++如何压缩字符串_c++实现简单的运行长度编码【实战】

运行长度编码（RLE）适合什么场景

用 std::string 实现 RLE 编码的要点

解码时容易漏掉的整数解析问题

c++ 中 RLE 不该用于通用压缩的真相

用 `std::string` 实现 RLE 编码的要点