加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

复杂正则表达式一

发布时间:2020-12-14 04:20:58 所属栏目:百科 来源:网络整理
导读:表达式 "(w)((?=111)(1))+" 在匹配字符串 "aaa ffffff 999999999" 时,将可以匹配6个"f"的前4个,可以匹配9个"9"的前7个 分析: 一、 (w)(1) 1. (w) -- w ,一个字符,括号表示一个子匹配,第一个括号是"1",第二个括号是"2",……。 2. (w)(1) -

表达式 "(w)((?=111)(1))+" 在匹配字符串 "aaa ffffff 999999999" 时,将可以匹配6个"f"的前4个,可以匹配9个"9"的前7个

分析:
一、

(w)(1)
1. (w) -- w,一个字符,括号表示一个子匹配,第一个括号是"1",第二个括号是"2",……。
2. (w)(1)-- 一个字符,后面紧跟一个相同的字符。
(之前复杂的正则,转为基本的(w)(1)。化繁为简,先弄清楚简单的,再向复杂推去。)

运行得:aa | ff | ff | ff | 99 | 99 | 99 | 99 | ,3个a,匹配了一次;6个f,匹配了三次;9个9,匹配了四次。
可见,(w)(1) -- 每次搜索两个字符,该字符与下一个相同即为true。


二、

(w)(?=111)
1. (?=1)-- ?=,据“正则表达式系统教程":

(?=pattern)正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。

2. (w)(?=111)-- 一个字符,后面紧跟三个相同的字符。但后三个字符不获取,也不消耗字符:如匹配“ffffff”,第一次查找,匹配到前四个ffff;第二次查找,从第二个“f”开始(不是从第五个开始,如无“?=”:(w)(111),则是从第五个开始),匹配了第二个“f”至第五个“f”;第三次查找,匹配了第三个“f”至第六个“f”;第四次查找,只剩下三个“f”,匹配不到。

运行得:f | f | f | 9 | 9 | 9 | 9 | 9 | 9 | ,四个字符连续相同才符合条件,但每次查找只消耗一个字符,即 index只+1,不是+4。


(w)(?=111)(1)
运行得:ff | ff | 99 | 99 | 99 |
(w)(?=111)(1)--- 相当于执行一次(w)(?=111)匹配,接着执行一次(w)(1) ,移到下一个索引,再继续前面的操作,如此循环。
(w)(?=111),参考“二、”,接着执行 (w)(1),(w)已完成,到(1) 了,它从第二个“f”开始,查找前面的字符相同否,同,匹配。第二次查找,从第三个“f”开始,也是只消耗两个 “f" 字符。第三次查找,只剩下两个“f”,(w)(?=111)匹配不到。9个9的查找类同,三次查找后,余 9-2*3=3 个“9”,”,(w)(?=111)需4个“9”才合,查找结束。假如10个“9”的话,第四次能匹配成功,出现四个“99”。


(w)(?=111)(1)+

运行得:ffffff | 999999999 |
1. (1)+--- +代表一个或多个,(1)+ 表示第一个的子匹配一个或多个。
2. (w)(?=111)(1)+--- 相当于先 (w)(?=111),再 (w)(1)+ ,接着下一索引继续。
 (w)(?=111),参考上面,接着执行 (1)+,从第二个“f”开始,它会将余下的“f” 全部匹配掉,“ffffff”的查找就结束了(接下来的是第二轮查找,对 9个“9”)。


(w)((?=111)(1))+

运行得:ffff | 9999999 |
1. ((?=111)(1))+--- 是整个“(?=111)(1)”的一个或多个。先(?=111),查找三个与第一个子匹配相合的;再(1) ,查找一个与第一个子匹配相合的;然后因有“+”,匹配多次。

2. (w)((?=111)(1))+--- 以“ffffff” 6个“f” 为例:①执行(w):找到一字符“f”,符合, ②执行(?=111):从第二个“f”开始,查找三个“f”,符合, ③执行(1):因前面不消耗字符,从第二个“f”开始,查找一个“f”,符合,④整个“(?=111)(1)”是 + 的,要匹配多次,相当于内循环,“(?=111)(1)”不断匹配下去,现从第三个“f”开始,查找三个“f”,符合,⑤现又到(1),从第三个“f”开始,查找一个“f”,符合,⑥…………,最后到剩下2个“f”时,(?=111) 不合,结束此轮查找。这样,(w)只执行一次,匹配最前面的“f”,“(?=111)(1)”不断匹配,执行三次,匹配了第二至第四个“f”,总共匹配了前面的四个“f”。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读