如何使用 PHP 正则表达式精准提取指定前缀行的数值（排除特定字符串开头的行）

1次阅读

本文详解如何在 php 中通过 preg_match_all() 配合否定型先行断言（negative lookahead），从多行文本中安全提取符合要求的数字（如 1,00），同时严格排除以 SS、FF、PP 开头的整行数据。

本文详解如何在 php 中通过 `preg_match_all()` 配合否定型先行断言（negative lookahead），从多行文本中安全提取符合要求的数字（如 `1,00`），同时严格排除以 `ss`、`ff`、`pp` 开头的整行数据。

在处理结构化但非标准的文本数据（如日志、报表片段）时，常需「按行过滤 + 提取数值」。本例中，原始文本包含混合格式的行：有的带双字母前缀（如 CC 1,00），有的纯数字（如 1,00），还有的是需屏蔽的前缀行（SS/FF/PP）。目标很明确：仅提取不被禁止前缀所“污染”的行中的浮点数格式数值（支持 , 或 . 作为小数点）。

关键在于正确理解并应用正则表达式的两个核心机制：

^(?!SS|FF|PP)：行首否定型先行断言，确保该行不以 SS、FF 或 PP 开头；
.*(d{1,2}[,.]d{1,2})$：贪婪匹配任意字符后捕获一个数字模式（1–2位整数 + 小数点或逗号 + 2位小数），并锚定到行尾。

以下是完整、可直接运行的 PHP 示例代码：

<?php $text = "CC 1,00nSS 1,00nPP 1,00n1,00nFF 1,00";  // 正则说明： // ^           → 行首锚点（配合 /m 修饰符启用多行模式） // (?!SS|FF|PP) → 否定先行断言：当前行不能以 SS/FF/PP 开头 // .*          → 匹配任意数量的任意字符（包括空格） // (d{1,2}[,.]d{1,2}) → 捕获组：匹配如 "1,00" 或 "12.99" 的数值（整数部分1-2位，小数点为 , 或 .，小数部分固定2位） // $           → 行尾锚点 $pattern = '/^(?!SS|FF|PP).*(d{1,2}[,.]d{1,2})$/m';  preg_match_all($pattern, $text, $matches, PREG_SET_ORDER);  // $matches 是二维数组，每个子数组对应一次匹配 // $match[0] 是整行匹配内容，$match[1] 是捕获的数值（即我们真正需要的部分） $result = array_column($matches, 1); // 提取所有捕获组第1项（即数值）  print_r($result); // 输出： // Array // ( //     [0] => 1,00 //     [1] => 1,00 // ) ?>

✅ 输出结果解析：

立即学习“PHP免费学习笔记（深入）”；