preg_match用于匹配字符串与正则模式,返回0或1,可提取内容到$matches数组。使用分隔符包围模式,支持i、u、m、s等修饰符增强匹配,如/u处理中文;通过()捕获子组,$matches[1]获取第一子组;避免回溯失控,优先用(?:…)非捕获组,用户输入需preg_quote转义特殊字符。

在php中,preg_match 是最常用的正则表达式匹配函数之一。它用于判断一个字符串是否符合指定的正则模式,并可提取匹配的内容。掌握其使用技巧,能有效提升文本处理能力。
基本语法与返回值
preg_match 函数的基本格式如下:
int preg_match ( String $pattern , string $subject [, Array &$matches ] )
它返回 0(未匹配)、1(匹配成功)。如果传入 $matches 参数,会将匹配结果存入该数组。
- $pattern:正则表达式,需包含分隔符(如 / 或 #)
- $subject:要检测的字符串
- $matches:可选,保存匹配内容的数组
示例:
立即学习“PHP免费学习笔记(深入)”;
$text = “Hello, my email is user@example.com”;
$pattern = ‘/[a-z]+@[a-z]+.[a-z]+/’;
if (preg_match($pattern, $text, $matches)) {
echo “找到邮箱:”, $matches[0];
}
使用修饰符增强匹配灵活性
正则表达式末尾可添加修饰符,改变匹配行为:
例如匹配中文名字:
$name = “张三”;
if (preg_match(‘/^[x{4e00}-x{9fa5}]{2,}$/u’, $name)) {
echo “是有效的中文姓名”;
}
捕获分组与反向引用
用括号 () 可定义捕获组,提取特定部分。$matches[0] 是完整匹配,$matches[1] 是第一个子组,依此类推。
例如提取日期中的年月日:
$dateStr = “今天的日期是2024-04-05”;
$pattern = ‘/(d{4})-(d{2})-(d{2})/’;
preg_match($pattern, $dateStr, $parts);
// $parts[1] => ‘2024’, $parts[2] => ’04’, $parts[3] => ’05’
在模式内部也可使用反向引用 1、2 表示前面的组:
// 匹配重复单词
preg_match(‘/b(w+)s+1b/’, ‘hello hello’, $m); // 匹配成功
注意性能与安全问题
正则表达式虽强大,但复杂模式可能导致回溯失控,影响性能。避免使用过于宽泛的量词如 .* 在不确定上下文中。
- 优先使用非捕获组 (?:…) 提升效率
- 对用户输入的模式进行验证或限制长度
- 长时间运行的脚本中,考虑设置最大执行时间
另外,若模式中包含变量,注意转义特殊字符,可用 preg_quote() 处理:
$keyword = “example.com (test)”;
$safe = preg_quote($keyword, ‘/’);
preg_match(“/$safe/”, $text);
基本上就这些。合理使用 preg_match,结合合适的模式和修饰符,就能高效完成大多数字符串匹配任务。关键是理解捕获机制和修饰符作用,避免过度复杂的正则。不复杂但容易忽略细节。


