c++如何截取字符串子串_c++ substr函数详细用法【教程】

9次阅读

substr是std::String成员函数,非全局函数,不可用于char*;pos为起始下标(≤size()),len为长度(非结束下标),越界自动截断,负数传参会因size_t转换导致异常。

c++如何截取字符串子串_c++ substr函数详细用法【教程】

直接说结论:substrc++ std::string 的成员函数,**不是全局函数,不能对 C 风格字符串char*)直接调用**;它默认从指定位置开始、向后截取指定长度,越界时会自动截断到末尾,不会崩溃但可能不符合预期。

substr 的两个参数怎么填才不踩坑

substr 原型是 string substr(size_t pos = 0, size_t len = npos) const,其中:

  • pos 是起始下标(从 0 开始),必须 ;若等于 size(),返回空串;若大于 size(),抛出 std::out_of_range
  • len 是要截取的字符数,不是结束下标;若 len 超出剩余字符数,实际只取到末尾
  • npos 是一个特殊值(通常是 size_t(-1)),表示“直到结尾”,不是“无限长”——它只是让函数内部按 size() - pos 计算

常见错误:用错起始位置或误以为 len 是结束索引

比如想从第 3 个字符取到倒数第 2 个,写成 s.substr(3, s.size()-2) 是错的——这会从下标 3 开始取 s.size()-2 个字符,远超实际范围。

正确做法分两步判断:

立即学习C++免费学习笔记(深入)”;

  • 先算有效起始点:size_t start = 3;
  • 再算真正要取的长度:size_t len = (s.size() >= 5) ? s.size() - 2 - start : 0;(避免无符号整数下溢)
  • 最后调用:s.substr(start, len)

和 C 风格字符串混用时必须先转 string

以下写法全部非法:

const char* cstr = "hello world"; cstr.substr(0, 5); // ❌ 编译失败:char* 没有 substr 成员 std::substr(cstr, 0, 5); // ❌ 没有这个全局函数

必须显式构造:

  • std::string(cstr).substr(0, 5)(临时对象,适合短逻辑)
  • std::string s(cstr); auto sub = s.substr(0, 5);(适合多次操作)
  • 如果原数据是 std::string_view(C++17),它也有 substr,行为一致但不分配内存

性能注意:substr 总是拷贝,大字符串慎用

substr 返回的是新 std::string,内部会分配内存并复制字符。对几 MB 的字符串反复调用,容易触发频繁分配。

替代方案视场景而定:

  • 只读遍历?用 std::string_view + substr(零拷贝)
  • 需要修改子串?还是得用 std::string,但尽量复用变量,避免链式调用如 s.substr(a,b).substr(c,d)
  • 频繁切片+拼接?考虑用 std::vector<:string_view> 管理片段,最后统一拼接

最常被忽略的一点:possize_t,传入负数会因类型转换变成极大正数,直接越界抛异常——别用 int 变量直接传参。

text=ZqhQzanResources