C++怎么实现KMP算法_C++字符串匹配教程【高效】

2次阅读

kmp不能用std::string::find替代，因其为o(nm)朴素匹配，而kmp通过next数组实现主串指针不回溯，适合多次复用pattern或流式匹配；next[0]必须为-1，构建时需判j>0防越界，匹配后应j=next[j]以支持重叠匹配。

为什么 `kmp_search` 不能直接用 `std::String::find` 替代

因为 std::string::find 是朴素匹配（O(nm)），而 KMP 的核心价值在「模式串回退不回溯主串指针」，适合多次复用同一 pattern 或流式匹配场景。比如解析协议报文、日志关键词实时扫描——这时手写 KMP 的 next 数组预处理才真正省时间。

常见错误现象：next[0] = -1 写成 0，或构建时用 next[j-1] 但没判 j > 0，导致越界或死循环。

next 数组定义：对 pattern[0..i]，next[i] 是最长真前缀长度，且该前缀等于后缀
构建时用双指针：i 扫描模式串位置，j 记录当前最长匹配前缀长度；每次失配时用 next[j-1] 跳转，不是简单 j--
初始化必须是 next[0] = -1（或 0，但后续逻辑要统一），否则边界 case 如 "aa" 匹配 "a" 会漏掉首字符

如何写一个不依赖 STL 迭代器的纯数组版 `kmp_match`

避免 std::string 隐式拷贝和迭代器开销，尤其在嵌入式或高频调用场景。直接操作 const char* + len 最可控。

使用场景：解析固定格式二进制协议头、内存池内字符串查找、无异常环境（如裸机驱动）。

立即学习“C++免费学习笔记（深入）”；

输入参数应为 const char* text, size_t text_len, const char* pattern, size_t pat_len，不传 std::string
next 数组建议栈分配（int next[256]），若 pat_len 可能超限则堆分配并检查 malloc 返回值
匹配循环里，主串索引 i 永不递减；失配时只更新 j = next[j]，直到 j == -1 或 text[i] == pattern[j+1]

示例关键片段：

int i = 0, j = -1; while (i < text_len) {     if (j == -1 || text[i] == pattern[j+1]) {         i++; j++;         if (j == (int)pat_len - 1) return i - j - 1; // 找到     } else {         j = next[j]; // 注意：这里 j 是当前已匹配长度-1，next[j] 是回退位置     } }

`next` 数组构建时 `if (j > 0 && pattern[i] != pattern[j])` 为什么不能省略 `j > 0`

因为 next 定义中允许 j == 0 时再失配，此时 next[j-1] 就是 next[-1] —— 未定义行为，轻则崩溃，重则静默错位。c++ 不做数组负索引检查。

性能影响：加这个判断几乎零开销，但能拦住 90% 的构建段错误。

标准构建循环里，j 初始为 -1，第一次进循环必走 if (j == -1 || ...) 分支，所以 j 在进入 else 前至少为 0
但若你把 next 改成 0-indexed（即 next[0] = 0），那失配时要用 next[j-1]，就必须确保 j > 0
更安全的写法是统一用 j = next[j] 并提前判 j >= 0，而不是依赖 j > 0

匹配失败后想继续找下一个位置，`j` 怎么重置才不漏解

很多人在找到第一个匹配后直接 j = 0，结果漏掉重叠匹配，比如在 "aaaa" 中找 "aa"，只返回位置 0，跳过了 1 和 2。

正确做法是利用 next 数组本身：找到后令 j = next[j]（注意 j 此时是 pat_len - 1），然后继续循环。

如果 next[j] == -1，说明无重叠可能，下次必须从 i++ 开始新匹配
如果 next[j] >= 0，说明 pattern[0..next[j]] 和 pattern[j-next[j]..j] 相同，可直接接续比较
别写 j = 0 或 j = -1 —— 这是朴素算法思维，KMP 的优势就在这里断掉了

实际调试时，打印每次匹配后的 j 值，比对着 "abababca" 和 "abab" 手算一遍 next，很快就能看清跳转逻辑。

发表于：开发工具

近一天内

# c++# char # const # if # int # len # String # 堆 # 字符串 # 循环 # 指针 # 栈 # 算法

复制链接

Composer怎么通过SSH安装依赖解决HTTPS克隆失败问题【技巧】

如何为Composer创建一个命令行别名（alias）来简化操作？

mysql主从复制原理_mysql高可用基础

XPath的id()函数怎么快速查找具有特定ID的元素

C# 手动内存管理方法 C#如何使用Marshal类分配和释放内存

C++怎么实现KMP算法_C++字符串匹配教程【高效】

为什么 `kmp_search` 不能直接用 `std::String::find` 替代

如何写一个不依赖 STL 迭代器的纯数组版 `kmp_match`

`next` 数组构建时 `if (j > 0 && pattern[i] != pattern[j])` 为什么不能省略 `j > 0`

匹配失败后想继续找下一个位置，`j` 怎么重置才不漏解

PHP执行PY调用机器学习模型快吗_高频AI调用方法【方法】

怎样使用VSCode_的GitLens扩展追踪代码历史【教程】

PHP短信接口返回错误码怎么看_错误码查询对照【指南】

市场热点如何形成_如何识别资金流向

JavaScript 中基于参考字符串列表对对象数组进行稳定排序的完整教程

mysql升级后如何恢复历史数据_mysql回滚流程说明

C# 文件操作的上下文传递 C#在异步流程中如何传递与文件相关的上下文信息

C++怎么使用gdb调试_C++调试工具教程【排错】

composer如何查看包的homepage链接_composer访问官方文档入口【查阅】

C#清空文件内容 C#如何快速删除文件里的所有数据

C++怎么实现KMP算法_C++字符串匹配教程【高效】

为什么 kmp_search 不能直接用 std::String::find 替代

如何写一个不依赖 STL 迭代器的纯数组版 kmp_match

next 数组构建时 if (j > 0 && pattern[i] != pattern[j]) 为什么不能省略 j > 0

匹配失败后想继续找下一个位置，j 怎么重置才不漏解

为什么 `kmp_search` 不能直接用 `std::String::find` 替代

如何写一个不依赖 STL 迭代器的纯数组版 `kmp_match`

`next` 数组构建时 `if (j > 0 && pattern[i] != pattern[j])` 为什么不能省略 `j > 0`

匹配失败后想继续找下一个位置，`j` 怎么重置才不漏解