如何使用Golang fuzz生成随机字符串_测试文本处理函数

21次阅读

go 1.18 引入内置模糊测试,需定义 func(*testing.F) 测试函数并调用 f.Fuzz 传入接受基本类型的闭包;可过滤无效输入、添加 seed corpus 提升效率;失败时自动生成最小复现用例。

如何使用Golang fuzz生成随机字符串_测试文本处理函数

Go 1.18 引入了内置的模糊测试(fuzzing)支持,它能自动为函数生成大量随机输入,帮你发现边界情况和潜在 panic。对文本处理函数(比如字符串截取、正则匹配、编码转换等)特别有用——你不用手动构造奇怪的 Unicode 组合、超长字符串或含 NUL 字节的输入,fuzz 会替你“暴力试探”。

1. 基础:写一个可 fuzz 的测试函数

必须满足两个条件:函数签名是 func(*testing.F),且在函数内调用 f.Fuzz 并传入一个只接受基本类型(String, int, bool, []byte 等)的闭包。

例如,测试一个安全截取前 N 个字符的函数:

func TestTruncateFuzz(t *testing.T) {     f := testing.Fuzz(t)     f.Fuzz(func(t *testing.T, s string, n int) {         // 避免负数或过大 n 导致 panic,fuzz 会自动生成各种值         if n < 0 {             n = 0         }         if n > 1000 {             n = 1000         }         _ = Truncate(s, n) // 你的待测函数     }) }

2. 控制输入范围:过滤无效组合

fuzz 生成的 string 可能包含控制字符、代理对不完整 UTF-8、空字符串等。若你的函数对某些输入有明确前提(如“只处理非空 ASCII 字符串”),可在 fuzz 闭包开头加简单校验跳过:

立即学习go语言免费学习笔记(深入)”;

  • if len(s) == 0 { t.Skip() } 跳过空字符串
  • if !utf8.ValidString(s) { t.Skip() } 过滤非法 UTF-8
  • if strings.Contains(s, "x00") { t.Skip() } 排除含 NUL 的字符串(适合 C 交互场景)

注意:不要在被测函数内部 panic 或返回错误来“防御”,fuzz 的目标就是暴露那些没处理好的 case。

3. 添加 seed corpus 提高效率

默认 fuzz 从纯随机开始,但你可以提供一些典型/边界样例(seed corpus),帮助引擎更快探索关键路径。在测试文件同目录下新建 fuzz/Truncate/corpus 文件夹,放入几个 .txt 文件:

  • empty.txt:内容为空
  • emoji.txt:内容为 "Hello ? ?‍?"(含 emoji 和 ZWJ 序列)
  • long.txt:10000 个 a 拼接的字符串
  • surrogate.txt:包含不完整代理对的字节序列(可用 []byte{0xed, 0xa0, 0x80} 写入)

运行时 Go 会自动加载这些样本作为 fuzz 起点。

4. 运行与调试失败案例

执行命令启动 fuzz:

go test -fuzz=FuzzTruncate -fuzztime=30s

如果触发 panic 或断言失败,Go 会自动保存复现该问题的最小输入到 test/fuzz//crashers/ 下(如 0016a7...txt)。直接复制文件内容,就能在普通单元测试里复现并修复:

func TestTruncateCrashCase(t *testing.T) {     s := "" // 从 crasher 文件里复制的字符串     got := Truncate(s, 1)     // 断言期望行为 }

修复后重新跑 fuzz,确认不再崩溃。

不复杂但容易忽略:fuzz 不是替代单元测试,而是补充——它帮你找到你没想到的 case;而单元测试确保你明确设计的逻辑始终正确。

text=ZqhQzanResources