正则表达式入门笔记
正则表达式是描述某些复杂字符串规则的工具,它是记录文本规则的代码。
转义字符 如果想查找元字符本身的话,比如查找.或者*就出现了问题,因为它们会被解释成别的意思,可以使用来取消这些字符的特殊意义。如:.和*,或者。 重复
字符类 想查找数字、字母和空白是很简单的,因为已经有了对应这些字符集合的与字符,但是如果你想匹配没有预定义元字符的字符集合,但是如果想匹配没有预定义的元字符集合,改怎么办?只需在方括号里将它们列出就行,如:[aeiou]就匹配任何一个英文元音字母,[.?!]匹配标点符号(.或?或!)。 也可以指定一个字符范围,如:[a-z0-9A-Z_] 分枝条件 正则表达式里的分枝条件指的是有几种规则,如果满足其中任意一种规则都应该当成匹配,具体方法是用|把不同的规则分隔开。 分组 用小括号来指定字表达式(也叫做分组),然后就可以指定这个字表达式的重复次数了。 反义 有时候需要查找不属于某个能简单定义字符类的字符,需要用到反义。
后向引用 使用小括号指定一个字表达式后,匹配这个字表达式的文本(也就是此分组捕获的内容)可以在表达式或其他程序中做进一步处理。默认情况下,每个分组或自动拥有一个组号,规则是:从左向右,以分组的左括号为标识,第一个出现的分组组号为1,第二个为2,以此类推 后向引用用于重复搜索前面某个分组匹配文本如:1代表分组1匹配的文本。如:b(w+)bs+1b可以用来匹配重复的单词 也可以自己指定字表达式的组名,语法为:(?<Word>w+)或者吧尖括号换成'也行,这样就把w+指定为Word了,要反响引用这个分组捕获的内容,你可以使用=k<Word>
零宽断言:用于查找某些内容(但并不包括这些内容)之前或之后的东西,也就是说他们b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(即断言) 负向零宽断言:用于想要确保某个字符没有出现,但并不想去匹配它。它只匹配一个位置,并不消费任何字符。 零宽度负预测先行断言(?!exp):断言此位置后面不能匹配表达式exp 零宽度负回顾后发断言(?<!exp):断言此位置的前面不能匹配表达式exp
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |