正则: console.log(('12345').match(/\d*/g));
匹配结果: ["12345", ""]
匹配过程如下:
第一次匹配:
\d*,因为没有位置限定,因此是从文本开始位置开始,也就是^
这个^是虚拟字符,也就是12345里的1前面的位置
\d*,贪婪匹配,0-n个,尽可能多匹配,因此,12345都匹配了
此时,正则匹配的位置到了5后面,完成第一次匹配。
第二次匹配:
但是,因为g模式,做的是全局匹配,因此,\d*从5后面位置开始,继续匹配,直到文本结束位置,也就是$
这个$也是虚拟字符,匹配文本的结束位置
\d*,因为是0-n个,此时,利用的0个匹配,因此得到"",完成第二次匹配。
上面,主要利用的知识点有:
1. 开始(^)和结束位置($)
2. 贪婪模式
3. * 的含义
4. 正则匹配的位置移动原理(正则引擎匹配原理)
正则: console.log(('12345').match(/1*/g));
匹配结果: ["1", "", "", "", "", ""]
匹配过程如下:
1* 首先从12345的1前面位置开始,贪婪模式,尽可能多匹配1,因此,匹配完后,正则的匹配开始位置到了2前面位置
1* 从2前面位置开始,单字符匹配,因为1没法匹配2,因此,用了*的特性,匹配0个,正则的匹配开始位置到了3前面位置
1* 从3前面位置开始,单字符匹配,因为1没法匹配3,因此,用了*的特性,匹配0个,正则的匹配开始位置到了4前面位置
1* 从4前面位置开始,单字符匹配,因为1没法匹配4,因此,用了*的特性,匹配0个,正则的匹配开始位置到了5前面位置
1* 从5前面位置开始,单字符匹配,因为1没法匹配5,因此,用了*的特性,匹配0个,正则的匹配开始位置到了5后面位置
1* 从5后面位置,单字符匹配,匹配文本结束位置,没有匹配1,用了*的特性,匹配0个,正则的匹配完成
更多示例,读者可尝试推演一下:
console.log(('12345').match(/12345??/g)); //1234
console.log(('12345').match(/12345?/g)); //12345
注:?? 等价于 {0,1}? 非贪婪模式,不匹配优先
? 等价于 {0,1} 贪婪模式,匹配优先
关于匹配次数??
和?
的讲解可以参考《正则表达式匹配次数》
未经同意禁止转载!
转载请附带本文原文地址:如何理解正则表达式匹配过程的原理,首发自 Zjmainstay学习笔记