如何在Go中读取文件内容_Go文件读取常见方式汇总

12次阅读

小文件用os.ReadFile(go1.16+)或ioutil.ReadFile(旧版),大文件用bufio.Scanner或bufio.Reader,二进制文件用os.Open+io.ReadFull或binary.Read,GBK等编码需用golang.org/x/text/encoding处理。

如何在Go中读取文件内容_Go文件读取常见方式汇总

直接用 ioutil.ReadFile 读小文件最省事

Go 1.16 之前推荐用 ioutil.ReadFile,它把打开、读取、关闭全包了,一行搞定。但注意:它会把整个文件一次性加载进内存,只适合小文件(比如配置、jsON、模板等)。

常见错误是拿它读几百 MB 的日志或二进制文件,结果程序 OOM 或卡死。

  • 文件路径必须存在且有读权限,否则返回 Error,别忽略它
  • 返回的 []byte 是原始字节,如果要字符串,手动转:String(data)
  • Go 1.16+ 警告:该函数已移到 os.ReadFileioutil 包被弃用
data, err := os.ReadFile("config.json") if err != nil {     log.Fatal(err) } content := string(data)

大文件必须用 bufio.Scannerbufio.Reader

逐行处理日志、csv、文本流时,bufio.Scanner 是首选。它默认单行上限 64KB,超限会报 scanner: Token too long 错误——这是新手最常踩的坑。

bufio.Reader 更底层、更灵活,适合按块读、跳过 bom、处理不定长记录等场景。

  • Scanner 不适合读二进制或含 NULL 字节的内容
  • Scan() 前必须检查 Err(),否则可能漏掉最后一次扫描失败的错误
  • 想改单行长度限制?用 Scanner.Buffer(make([]byte, 4096), 1 设置最大 token 长度为 1MB
file, _ := os.Open("access.log") scanner := bufio.NewScanner(file) for scanner.Scan() {     line := scanner.Text() // 不是 Bytes(),除非你要保留换行符     process(line) } if err := scanner.Err(); err != nil {     log.Fatal(err) }

os.Open + io.ReadFull 适合固定结构二进制文件

读取图片头、协议帧、自定义二进制格式时,你往往知道字段长度和顺序。这时候别用字符串或 Scanner,直接用 os.Open 打开,配合 binary.Readio.ReadFull 控制精度。

典型错误是用 ReadAll 读 PNG 头却忘了前 8 字节固定,导致解析失败;或者没检查 ReadFull 返回的 io.ErrUnexpectedEOF

  • io.ReadFull 要求「必须读满」指定字节数,少一个字节就报错
  • 结构体推荐 binary.Read(r, binary.BigEndian, &header),比手撕位移更安全
  • 记得用 defer f.Close(),文件描述符泄漏在长期运行服务中很致命
f, _ := os.Open("image.bin") defer f.Close() var header [8]byte if _, err := io.ReadFull(f, header[:]); err != nil {     log.Fatal(err) // 可能是 EOF,也可能是磁盘错误 }

编码转换得用 golang.org/x/text/encoding

Go 标准库不原生支持 GBK、Shift-JIS、Big5 等编码。遇到 windows 记事本保存的 ANSI 文件(其实是 GBK),直接用 os.ReadFile 读出来就是乱码。

别试图用 strings.ToValidUTF8 补救——那是修显示,不是解码。必须在读取时做正确解码。

  • 先用 encoding.RegisterPseudoEncoding 注册别名(如 “gbk” → “GBK”)
  • charmap.GBK.NewDecoder().Bytes(data) 解码原始字节
  • 流式读取时,把 Decoder 套在 Reader 上:transform.NewReader(f, gbkDecoder)
import "golang.org/x/text/encoding/charmap" // ... f, _ := os.Open("readme_gbk.txt") defer f.Close() reader := charmap.GBK.NewDecoder().Reader(f) content, _ := io.ReadAll(reader) // content 是合法 UTF-8 []byte

实际项目里,选哪种方式不取决于“看起来高级”,而取决于:文件多大、有没有编码问题、要不要流式处理、是否需随机访问。很多 bug 出在把日志文件当小配置读,或把 GBK 文本当 UTF-8 解析——这两类错误几乎占了 Go 文件读取问题的七成。

text=ZqhQzanResources