如何掌握JavaScript中的正则表达式_JavaScript如何使用正则进行字符串匹配

12次阅读

String.prototype.match() 完全不匹配时返回 NULL 而非空数组,易致 TypeError;全局匹配返回字符串数组,非全局才含 index、groups 等属性。

如何掌握JavaScript中的正则表达式_JavaScript如何使用正则进行字符串匹配

为什么 String.prototype.match() 返回 null 而不是空数组

因为目标字符串完全不匹配正则时,match() 明确返回 null,不是 []。这是最容易踩的坑——直接对返回值调用 .Length 或遍历会报 TypeError: Cannot read Property 'length' of null

  • 安全写法是先判断: const result = str.match(/pattern/); if (result) { ... }
  • 全局匹配(带 g 标志)时,match() 返回匹配字符串数组,不包含捕获组信息;非全局时才返回含 indexgroups 等属性的数组
  • 想统一得到数组(哪怕为空),可用 str.match(/pattern/g) || [],但注意这会丢失非全局模式下的位置和分组数据

regexp.prototype.exec()test() 的真实分工

exec() 不只是“另一个匹配方法”,它是唯一支持**连续查找**和**捕获组提取**的正则方法;test() 则专为布尔判断设计,性能更高,但不返回任何匹配细节。

  • 需要循环提取所有匹配(尤其含捕获组):必须用 exec(),且要手动重置 lastIndex(对全局正则)或确保正则对象未复用
  • 只关心“是否匹配”:用 test(),比 match()exec() 快,尤其在大量校验场景(如表单验证
  • 错误用法:把同一个全局正则实例反复传给 exec() 而不重置 lastIndex,会导致第二次调用返回 null(因上次匹配后 lastIndex 指向末尾)
const re = /a(b)/g; let str = 'abab'; console.log(re.exec(str)); // ['ab', 'b'] console.log(re.exec(str)); // ['ab', 'b'] —— 正确,re.lastIndex 已更新 // 但如果 re 是 const 声明且跨多次调用,需注意状态残留

字符类 [^...] 和负向先行断言 (?!...) 别混用

[^abc] 是“除 a、b、c 外的任意单字符”,作用域仅限一个位置;(?!abc) 是“接下来三个字符不能是 abc”,是零宽断言,不消耗字符,常用于排除特定前缀。

  • 想匹配“不以 http:// 开头的 URL”:用 ^(?!http://).+,不是 ^[^http://].+(后者语法错误,且 [^http://] 实际等价于 [^htp:/]
  • 想匹配“后面不是数字的字母”:用 [a-z](?!d);若写成 [a-z][^d],会多匹配一个非数字字符,语义完全不同
  • 负向断言在 safari 旧版本或某些 node.js 版本中可能不支持,需检查 /(? 是否报错(lookbehind 在 Node.js

修饰符 us 不是可有可无的配置项

u(Unicode)让正则正确处理 UTF-16 代理对(如 emoji、中文、数学符号);s(dotAll)让 . 匹配换行符。忽略它们,在处理现代文本时大概率出错。

立即学习Java免费学习笔记(深入)”;

  • 匹配含 emoji 的字符串:/?‍?{2}/.test('?‍??‍?') 返回 false,加 u 后才为 true(否则正则把 emoji 当作两个孤立代理符)
  • 跨行匹配 html 标签内容:/
    (.*?)/s 中的 s.*? 能穿过换行;没它,. 会停在第一行末尾

  • node.js 12+、chrome 64+ 支持 s,但 IE 完全不支持;u 在 Node.js 0.12+ 和主流浏览器均可用
  • 复杂点在于:正则逻辑本身简单,但字符编码、引擎差异、修饰符组合带来的行为变化非常隐蔽。写完正则别急着提交,拿边界数据(空字符串、emoji、换行、中文、特殊符号)跑一遍 test()exec()

text=ZqhQzanResources