php如何计算中文字符长度 php获取中文长度【指南】

6次阅读

用 `mb_strlen()` 而不是 `strlen()`

php 默认的 strlen() 按字节计数，一个 UTF-8 中文字符占 3 字节，结果就是“你好”返回 6，完全不能反映真实字符数。mb_strlen() 才是专为多字节编码设计的函数，它能正确识别中文、日文、emoji 等 Unicode 字符。

必须显式指定编码，否则依赖默认内部编码（可能不是 UTF-8）：
mb_strlen($str, 'UTF-8')

不传第二个参数时，行为不可靠——尤其在 mb_internal_encoding() 被改过或未设的情况下
如果字符串实际是 GBK 编码（比如老系统），却硬写 'UTF-8'，结果会错乱甚至截断
常见错误现象：mb_strlen("你好", 'UTF-8') 返回 2 ✅；但 mb_strlen("你好", 'GBK') 返回 4 ❌（GBK 下每个中文占 2 字节，但它仍按字符逻辑算，所以其实也返回 2 ——重点是：别混用编码！）

注意 `mb_strlen()` 的扩展依赖和配置

这个函数属于 mbstring 扩展，不是 PHP 默认始终开启的。线上环境常有没装或被禁用的情况，直接调用会报 Fatal Error: Uncaught Error: Call to undefined function mb_strlen()。

检查是否启用：extension_loaded('mbstring') 或运行 php -m | grep mbstring
没启用时，apache 下需确认 php.ini 中 extension=mbstring 未被注释；CLI 环境可能用的是另一份 php.ini，得单独查
某些 docker 镜像（如 php:alpine）默认不带 mbstring，要手动 apk add php82-mbstring 类似操作

替代方案：没有 `mbstring` 时怎么安全 fallback

真遇到无法启用扩展的受限环境（比如某些共享主机），可用 iconv_strlen() 替代，它也支持多字节，且更轻量：

立即学习“PHP免费学习笔记（深入）”；

iconv_strlen($str, 'UTF-8')

它不依赖 mbstring，只要 iconv 扩展存在（PHP 几乎都自带）
但要注意：当字符串含非法 UTF-8 序列时，iconv_strlen() 可能返回 false，而 mb_strlen() 会尽力解析并返回近似值
别用正则 preg_match_all('/./u', $str) ——性能差，且对某些组合字符（如带变音符号的汉字、ZWJ 连接 emoji）统计不准

中文长度计算的实际陷阱：全角/半角、空格、不可见字符

“中文字符长度”在业务中往往不只是技术问题。比如用户昵称限制 10 个字符，但“ａｂｃ”（全角 ASCII）和“abc”（半角）视觉一样长，mb_strlen() 都算作 3；而“ ”（中文空格）、“　”（全角空格）、零宽空格 u200b 全都会被计入。

前端输入没过滤时，用户可能粘贴带格式文本，导致看似只有 5 个字，实际长度超限
建议入库前用 mb_ereg_replace('[[:space:]]+', ' ', $str) 清理多余空白，或用 trim() + mb_convert_kana() 统一全半角（后者需 mbstring）
emoji 表情如 ??、?‍? 在 UTF-8 下占多个码点，mb_strlen() 默认按 Unicode 码点计，通常没问题；但若需按“视觉字形”计数（比如排版），就得上 grapheme_* 函数了——那又是另一层复杂度

真正麻烦的从来不是“怎么算”，而是“算什么”——业务定义模糊时，mb_strlen() 给出的数字只是起点，不是答案。

发表于：后端开发

五天前

复制链接

C++STL容器迭代器操作与性能优化

如何在Golang中构建基于gRPC的微服务_Golang gRPC微服务框架与协议设计

Golang Web项目如何做权限控制_权限校验设计思路总结

Go语言时间字符串解析指南：灵活运用time.Parse与标准格式常量

PHP 数组在缓存系统中的进阶用法

php如何计算中文字符长度 php获取中文长度【指南】

用 `mb_strlen()` 而不是 `strlen()`

注意 `mb_strlen()` 的扩展依赖和配置

替代方案：没有 `mbstring` 时怎么安全 fallback

中文长度计算的实际陷阱：全角/半角、空格、不可见字符

html中如何在两个水平线中添加文字

如何正确理解 SVG 元素与 URL 解码的常见误区

Linux LVS 高可用负载均衡部署

SQL分表合并策略_分表归并与数据迁移

如何在VB生成的HTML邮件表格中根据单元格数值动态设置背景色

如何在父容器中精确居中一个元素，同时将另一个元素紧邻其右侧布局

PrestaShop 订单明细与购物车商品记录不一致的排查与修复指南

怎么在vscode中新建文件夹

资金费率过高意味着什么_如何用费率判断 Web3 情绪

Laravel 8 中基于数据库时间动态调度任务的完整实现指南

php如何计算中文字符长度 php获取中文长度【指南】

用 mb_strlen() 而不是 strlen()

注意 mb_strlen() 的扩展依赖和配置

替代方案：没有 mbstring 时怎么安全 fallback

中文长度计算的实际陷阱：全角/半角、空格、不可见字符

用 `mb_strlen()` 而不是 `strlen()`

注意 `mb_strlen()` 的扩展依赖和配置

替代方案：没有 `mbstring` 时怎么安全 fallback