c++中使用Protobuf需定义.proto文件、用protoc生成C++代码,再通过SerializeToString序列化和ParseFromString反序列化;须检查返回值确保字段已设且数据有效。

在 C++ 中使用 Protocol Buffers(Protobuf)做数据序列化和反序列化,核心是定义 .proto 文件、生成 C++ 代码、再用生成的类进行编解码。它天然支持跨语言通信,只要各端用同一份 .proto 定义,就能互相解析。
定义并编译 .proto 文件
先写一个描述数据结构的 person.proto:
syntax = "proto3"; message Person { string name = 1; int32 id = 2; string email = 3; }
用 Protobuf 编译器生成 C++ 代码:
protoc --cpp_out=. person.proto
会生成 person.pb.h 和 person.pb.cc,需在项目中包含并链接 libprotobuf。
立即学习“C++免费学习笔记(深入)”;
序列化:将对象转为二进制字节流
创建对象 → 填充字段 → 调用 SerializeToString() 或 SerializeToArray():
- 确保所有 required 字段(proto2)或非 optional 字段(proto3)已设置,否则序列化失败
- 推荐用
SerializeToString(std::string* output),避免手动管理内存 - 返回
bool,务必检查是否成功
Person person; person.set_name("Alice"); person.set_id(123); person.set_email("alice@example.com"); <p>std::string data; if (!person.SerializeToString(&data)) { // 序列化失败,通常因字段未设或内存不足 }
反序列化:从字节流还原对象
用 ParseFromString() 或 ParseFromArray(),注意初始化和错误处理:
- 目标对象无需预先构造完整数据,调用前可为默认构造
- 若字节流损坏、字段编号错或类型不匹配,解析会失败,返回
false - proto3 中未出现的字段会被忽略;proto2 中缺失 required 字段会导致解析失败
Person parsed; if (parsed.ParseFromString(data)) { std::cout << parsed.name() << ", " << parsed.id() << "n"; } else { // 解析失败,可能是数据被篡改、版本不兼容或传输截断 }
跨语言通信的关键实践
要保证不同语言(如 python/java/Go)之间互通,必须遵守以下约定:
- 所有服务共用同一套
.proto文件,并统一使用 proto3(推荐,更简洁且默认兼容性好) - 字段编号固定不变,新增字段只能加在末尾,且必须设为
optional(proto3 中所有字段默认可选) - 避免使用浮点数做精确比较,不同语言底层实现可能有细微差异
- 传输时建议带上版本标识或消息类型 ID(例如用一个 enum 区分不同 message),便于服务端路由和兼容升级