php怎么写兼容正则匹配_php兼容preg与ereg函数用法介绍【介绍】

1次阅读

php 7.0 起彻底移除 ereg 系列函数,必须迁移到 preg 系列;ereg 基于 bre 语法,preg 基于 pcre 且需定界符和 u 等修饰符;替换中 $1 无效,须用 ‘1’ 或 ‘$1’(单引号);中文匹配须 utf-8 编码加 u 修饰符;preg_match 返回 1/0 而非长度,条件判断需调整。

php怎么写兼容正则匹配_php兼容preg与ereg函数用法介绍【介绍】

PHP 7.0 起已彻底移除 ereg 系列函数(eregeregiereg_replaceeregi_replace),无法通过配置或扩展恢复;所有旧代码必须迁移到 preg 系列函数(如 preg_matchpreg_replace)才能在现代 PHP 中运行。

ereg 和 preg 的核心语法差异

ereg 使用基础正则语法(BRE),不支持分组捕获的命名、断言、修饰符需写在函数参数里;preg 基于 PCRE,要求正则模式必须用定界符包裹(如 /pattern/#pattern#),修饰符(如 im)写在结尾。

  • ereg("^[a-z]+$", $str) → 改为 preg_match("/^[a-z]+$/", $str)
  • eregi("hello", $str) → 改为 preg_match("/hello/i", $str)i 代替大小写忽略)
  • ereg_replace("([0-9])", "[1]", $str) → 改为 preg_replace("/([0-9])/","[1]",$str)(注意:反斜杠在双引号字符串中需转义为 1

替换操作中 $1 与 1 的坑

ereg_replace 允许在替换字符串中直接写 引用捕获组;preg_replace 默认只认 (双反斜杠),且若使用双引号字符串,还需再逃逸一次变成 "" —— 实际生效的是单个

  • 错误写法:preg_replace("/(d+)/", "$1", $str)$1 不被解析,原样输出
  • 正确写法:preg_replace("/(d+)/", "1", $str)(单引号或双引号均可)
  • 更安全写法:preg_replace("/(d+)/", '$1', $str)(单引号避免变量解析干扰)
  • 想用命名捕获?只能用 preg_replace("/(?P<digit>d+)/", "${digit}", $str)</digit>

中文字符匹配失败的常见原因

直接用 /[x{4e00}-x{9fff}]/u 匹配中文是可行的,但旧 ereg 根本不支持 Unicode 模式;迁移到 preg 后若仍匹配不到中文,大概率是没加 u 修饰符,或源字符串编码不是 UTF-8。

立即学习PHP免费学习笔记(深入)”;

  • 确保字符串是 UTF-8:mb_convert_encoding($str, 'UTF-8', 'auto')
  • 正则必须带 upreg_match("/[x{4e00}-x{9fff}]+/u", $str)
  • 避免用 . 匹配中文:默认不匹配换行和 Unicode 字符,应改用 [sS](?s).+

最易被忽略的是:preg 函数返回值类型变了——preg_match 成功时返回 1,失败返回 0,出错才返回 false;而旧 ereg 成功返回匹配长度,失败才返回 false。条件判断里直接写 if (ereg(...)) 的代码,迁过去后可能逻辑反转。

text=ZqhQzanResources