php怎么删除非整型字符 php如何提取字符串里的整数【学习】

3次阅读

filter_var最稳妥提取纯整数,能正确处理±号和前导空格;filter_sanitize_number_int得数字字符串,再(int)转整型需防溢出;preg_replace(‘/d/’等易丢符号,preg_match须用严格模式如’/-?d+/’。

php怎么删除非整型字符 php如何提取字符串里的整数【学习】

filter_var 提取纯整数最稳妥

直接用正则容易漏掉负号或边界情况,filter_varphp 原生支持的类型过滤方案,对整数识别更严谨。它能正确处理开头的 +-,也跳过前导空格,比手写 preg_match 更少出错。

  • 只提取第一个连续整数:用 filter_var($str, FILTER_SANITIZE_NUMBER_INT) 得到带符号数字字符串(如 "-123abc45""-123"
  • 想转成真正整型变量:再套一层 (int)intval(),但注意溢出时会截断为 PHP_INT_MAXPHP_INT_MIN
  • 不推荐用 preg_replace('/D/', '', $str) —— 它会把 "-12a3" 变成 "123",丢掉负号,且无法区分 "1.23" 中的点

preg_match 匹配完整整数(含负号和边界)

如果必须用正则(比如要提取多个整数),得严格限定模式,否则会匹配到小数点、科学计数法甚至 Unicode 数字字符。

  • 安全模式:preg_match('/(? —— <code>(? 和 <code>(?!d) 确保前后不是数字,避免从 "1234" 里错拆出 "12""34"
  • 要捕获全部整数:用 preg_match_all('/(?,结果在 <code>$matches[0]
  • 别用 /-?d+/ —— 它会把 "abc-123def" 中的 -123 拿出来,但也会把 "12.34"1234 都抓出来

删除非整型字符 ≠ 提取整数,二者目标不同

很多人混淆“删掉非数字字符”和“提取合法整数”。前者是粗暴清洗(如 "a1b2c3""123"),后者是语义解析("price: -¥123.45"-123)。PHP 没有内置“删非整型字符”的函数,str_replacepreg_replace 都只是字符层面操作,不理解数值含义。

  • 若真要删非整型字符(包括负号、小数点都不留):用 preg_replace('/[^0-9]/', '', $str),但结果一定是非负整数字符串
  • 若想保留负号但不要小数点:得写两步,先 preg_replace('/[^0-9-]/', '', $str),再用 filter_var(..., FILTER_VALIDATE_INT) 校验是否合法
  • 注意 mb_ereg_replace 在多字节字符串中可能失效,PHP 8+ 推荐统一用 preg_replace + u 修饰符处理 UTF-8

性能与兼容性差异很小,但 PHP 8 的 filter_var 更严格

三种方式在普通字符串上性能差距可以忽略,但行为差异在边界 case 上很明显。PHP 8 对 filter_var 的整数校验加了额外限制,比如拒绝 "0123"(八进制前缀)和超长数字串,而 PHP 7 会静默转成 0 或截断。

立即学习PHP免费学习笔记(深入)”;

  • PHP 7.4 及以下:filter_var('0123', FILTER_SANITIZE_NUMBER_INT) 返回 "0123";PHP 8.0+ 返回 "0"
  • 跨版本兼容建议:不用前导零的输入,或自己用 ltrim($str, '0') 预处理
  • 如果字符串极长(如日志行),preg_matchfilter_var 略快,但差别在微秒级,优先选语义清晰的方案

实际用的时候,多数场景下直接 filter_var($str, FILTER_SANITIZE_NUMBER_INT)(int) 就够了。真正难的是判断“这个字符串到底算不算一个整数”——比如 "1e2" 是数字但不是整型,"Ⅴ"(罗马数字)是 Unicode 数字但 filter_var 不认。这种边界得按业务定规则,没通用解。

text=ZqhQzanResources