Golang字符串怎么用_string常见操作汇总

7次阅读

go字符串底层是UTF-8字节流,len()返回字节数而非字符数;字符串不可变,所有“修改”实为新建;高频拼接用Strings.Builder,改中文字符需[]rune转换。

Golang字符串怎么用_string常见操作汇总

字符串长度和遍历:别再用 len() 数中文字符了

Go 字符串底层是 UTF-8 字节流,len("你好") 返回的是 6(每个中文占 3 字节),不是你想要的“2 个字符”。直接用索引或 for i := 0; i 遍历,遇到中文会切出乱码字节,甚至 panic。

  • 要获取真实字符数:用 utf8.RuneCountInString(s)len([]rune(s))
  • 安全遍历每个 Unicode 字符(包括 emoji、中文):必须用 for _, r := range s(自动按 rune 拆分)
  • 需要带索引的字符位置?转成 []rune循环rs := []rune(s); for i, r := range rs { ... },但注意这会分配新内存

查找与判断:大小写、空串、边界情况全得想清楚

strings.Contains("golang", "go") 返回 false —— 它严格区分大小写。别急着 strings.ToLower 全转小写再查,某些 Unicode 字符(比如土耳其语的 i)会出错。

  • 忽略大小写的正确姿势:用 strings.ContainsFold(),它做了 Unicode 归一化,语义更准
  • strings.Split("a,,b", ",") 返回 []string{"a", "", "b"},中间那个空字符串容易导致 index out of range;如需过滤,用 strings.FieldsFunc(s, func(r rune) bool { return r == ',' }) 或手动 len(part) > 0 判断
  • strings.TrimSuffix("foo.tar.gz", ".gz") 只剥一层后缀,不会继续剥 .tar;真要多层清理,得自己写循环

修改与拼接:字符串不可变,不是“改”,是“造新”

你不能写 s[0] = 'H',Go 会编译报错。所有“修改”操作本质都是构造新字符串 —— 这既是安全保证,也是性能隐患的源头。

  • 单次替换/截取:放心用 strings.ReplaceAll()strings.TrimSpace() 等,它们返回新串,原串不动
  • 高频拼接(比如日志聚合、模板渲染):禁用 + 循环,改用 strings.Builder,先 Grow() 预估容量,再反复 WriteString()
  • 想改某个字符?必须走 []rune 转换路径:rs := []rune(s); rs[1] = 'x'; s = string(rs);千万别用 []byte 改中文,会破坏 UTF-8 编码

格式化与类型转换:别让 fmt.Sprintf 混进热路径

fmt.Sprintf("%s:%d", name, age) 写起来爽,但它要解析格式字符串、做反射、分配临时对象 —— 在高并发或高频调用场景(比如 http 中间件打日志),开销明显高于纯字符串拼接。

立即学习go语言免费学习笔记(深入)”;

  • 简单连接 + 类型已知:优先 strconv.Itoa() 转数字,再用 Builder
  • 需要对齐、精度控制(如 %6.2f)、或结构体调试输出:fmt.Sprintf 仍是首选
  • 用户输入清洗后比较?别直接 ==,先 strings.TrimSpace() + strings.EqualFold(),兼顾空白和大小写

最常被跳过的细节是:所有 strings 函数都不改原串,也不关心你传进来的是不是 nil 字符串指针 —— 它们只处理 string 类型值。如果你在函数里接收 *string,记得先解引用再操作,否则可能 panic 或逻辑错位。

text=ZqhQzanResources