加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则表达式 高级规则——四(贪婪与非贪婪)

发布时间:2020-12-14 00:46:00 所属栏目:百科 来源:网络整理
导读:匹配次数中的贪婪与非贪婪 在使用修饰匹配次数的特殊符号时,有几种表示方法可以使同 一个表达式能够匹配不同的次数, 比如: "{m,n}","{m,}","?","*", "+", 具体匹配的次数随被匹配的字符串而定。 这种重复匹配不定次 数的表达式在匹配过程中,总是尽可能

匹配次数中的贪婪与非贪婪

在使用修饰匹配次数的特殊符号时,有几种表示方法可以使同一个表达式能够匹配不同的次数,

比如:"{m,n}","{m,}","?","*","+",具体匹配的次数随被匹配的字符串而定。这种重复匹配不定次数的表达式在匹配过程中,总是尽可能多的匹配。

比如,针对文本"dxxxdxxxd",

举例如下:

表达式 匹配结果

(d)(/w+) "/w+" 将匹配第一个 "d" 之后的所有字符"xxxdxxxd"


(d)(/w+)(d) "/w+" 将匹配第一个 "d" 和最后一个 "d" 之间的所

字符 "xxxdxxx"。虽然 "/w+" 也能够匹配上最后一个 "d",

但是为了使整个表达式匹配成功,"/w+" 可以 "让出"

它本来能够匹配的最后一个 "d"


由此可见,"/w+" 在匹配的时候,总是尽可能多的匹配符合它规则的字符。虽然第二个举例中,它没有匹配最后一个 "d",但那也是为了让整个表达式能够匹配成功。同理,带 "*" 和 "{m,n}" 的表达式都是尽可能地多匹配,带 "?" 的表达式在可匹配可不匹配的时候,也是尽可能的 "要匹配"。这 种匹配原则就叫作 "贪婪" 模式 。



非贪婪模式:
在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次 数不定的表达式尽可能少的匹配,使可匹配可不匹配的表达式,尽 可能的 "不匹配"。这种匹配原则叫作 "非贪婪" 模式,也叫作 "勉强" 模式。如果少匹配就会导致整个表达式匹配失败的时候,与贪婪模 式类似,非贪婪模式会最小限度的再匹配一些,以使整个表达式匹 配成功。举例如下,针对文本 "dxxxdxxxd" 举例
表达式 匹配结果

(d)(/w+?) "/w+?" 将尽可能少的匹配第一个 "d" 之后的字符,

结果是:"/w+?" 只匹配了一个 "x"

(d)(/w+?)(d) 为了让整个表达式匹配成功,"/w+?" 不得不匹配 "xxx"

才可以让后边的 "d" 匹配,从而使整个表达式匹配成功。

因此,结果是:"/w+?" 匹配 "xxx"


更多的情况,举例如下:

举例 1:

表达式 "<td>(.*)</td>" 与字符串 "<td><p>aa</p></td><td><p>bb</p></td>" 匹配时,匹配的结果是:成功;匹配到的内容是 "<td><p>aa</p></td> <td><p>bb</p></td>" 整个字符串, 表达式中的 "</td>" 将与字符串中最后一个 "</td>" 匹配。


举例 2:

相比之下,表达式 "<td>(.*?)</td>" 匹配举例 1 中同样的字符串时,将只得到 "<td><p>aa</p></td>", 再次匹配下一个时,可以得到第二个 "<td><p>bb</p></td>"。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读