C++如何进行模糊测试(Fuzz Testing)?libFuzzer在C++中的应用【软件测试】

1次阅读

c++中最主流、集成度最高的模糊测试方案是libFuzzer,它以静态库形式链接代码,需编写LLVMFuzzerTestOneInput函数,配合Clang与Sanitizer进行覆盖率引导 fuzzing。

C++如何进行模糊测试(Fuzz Testing)?libFuzzer在C++中的应用【软件测试】

在C++中做模糊测试,最主流、集成度最高、适合开发者日常使用的方案是 libFuzzer —— 它不是独立运行的黑盒工具,而是以静态库形式链接进你的代码,通过编写一个轻量级的 fuzz target 函数,就能让编译器(Clang)自动注入覆盖率引导的随机输入,持续发现崩溃、断言失败、内存越界等缺陷。

libFuzzer 的核心使用流程

它依赖 Clang 编译器和 Sanitizer(尤其是 AddressSanitizer 和 undefinedBehaviorSanitizer),整个过程是白盒+覆盖率驱动的:

  • 写一个函数 LLVMFuzzerTestOneInput(const uint8_t *data, size_t size),把待测逻辑“塞进去”
  • clang++ -fsanitize=fuzzer,address,undefined 编译(注意:必须用 Clang,GCC 不支持)
  • 直接运行生成的可执行文件,libFuzzer 自动启动 fuzz loop,生成输入、执行、监控崩溃、保存用例
  • 崩溃时会自动生成 crash-xxx 文件,可用 gdb ./fuzz_target crash-xxx 直接复现定位

一个最小可运行的 fuzz target 示例

比如你要测试一个解析 jsON 字符串的函数 parse_json(const char* s)

#include <cstdint> #include <cstddef> <p>extern "C" int LLVMFuzzerTestOneInput(const uint8_t <em>data, size_t size) { // 确保 data 是以  结尾的字符串(避免越界读) if (size == 0) return 0; // 构造临时缓冲区,保证结尾有  char </em>buf = new char[size + 1]; memcpy(buf, data, size); buf[size] = '';</p><p>parse_json(buf);  // 调用你的真实函数</p><p><span>立即学习</span>“<a href="https://pan.quark.cn/s/6e7abc4abb9f" style="text-decoration: underline !important; color: blue; font-weight: bolder;" rel="nofollow" target="_blank">C++免费学习笔记(深入)</a>”;</p>                     <div class="aritcle_card">                         <a class="aritcle_card_img" href="/ai/2411">                             <img src="https://img.php.cn/upload/ai_manual/001/246/273/176429994056517.png" alt="短影AI">                         </a>                         <div class="aritcle_card_info">                             <a href="/ai/2411">短影AI</a>                             <p>长视频一键生成精彩短视频</p>                             <div class="">                                 <img src="/static/images/card_xiazai.png" alt="短影AI">                                 <span>170</span>                             </div>                         </div>                         <a href="/ai/2411" class="aritcle_card_btn">                             <span>查看详情</span>                             <img src="/static/images/cardxiayige-3.png" alt="短影AI">                         </a>                     </div>                 <p>delete[] buf; return 0; }

⚠️ 注意:所有外部依赖(如 parse_json)必须被编译进同一个二进制;若函数在单独的 .cpp 文件里,记得一起编译进去。

提升 fuzz 效果的关键技巧

libFuzzer 不是“扔进去就完事”,合理设计能显著提升发现深度漏洞的能力:

  • 避免非确定性行为:关闭随机数、时间戳、线程、文件/网络 I/O——fuzz target 必须纯函数式、可重入、每次输入相同就输出相同
  • __AFL_LOOP-runs= 控制迭代次数:适合 CI 中做轻量回归,例如 ./fuzz_target -runs=100000
  • 提供语料库(corpus):把已知合法/非法样例放进目录,用 ./fuzz_target seed_corpus/ 启动,libFuzzer 会基于它们变异出新输入
  • 加字典(dictionary):对协议类代码(如 JSON、HTTP),用 -dict=json.dict 告诉 fuzzer 常见关键字("{", "name", ":"),大幅提升结构化输入生成效率

常见问题与绕过方法

实际用起来容易卡在几个典型问题上:

  • “undefined reference to `LLVMFuzzerTestOneInput`”:没定义该函数,或拼写错误(必须是 extern “C”,大小写严格)
  • “Failed to allocate” 或快速退出:检查是否在 fuzz target 内部做了大量分配但没释放,触发 sanitizer 的内存限制;可加 -max_len=4096 限制输入长度
  • 找不到崩溃?试试 -detect_leaks=1(检测内存泄漏)、-timeout=20(超时检测挂起)
  • 想测 C++ 类成员函数:把它包装成静态函数或 Lambda(捕获 this 需谨慎),确保无状态残留

基本上就这些。libFuzzer 上手门槛低,但威力很强——尤其适合单元级别、库级别、parser / serializer / codec 这类数据驱动模块的自动化健壮性验证。不需要额外部署服务,不依赖 python 脚本,一次编译,反复运行,崩溃即证据。

text=ZqhQzanResources