正则表达式入门笔记

发布时间：2020-12-14 01:44:43 所属栏目：百科来源：网络整理

导读：正则表达式是描述某些复杂字符串规则的工具，它是记录文本规则的代码。元字符代码说明 . 匹配除了换行符以外的任意字符 w 匹配字符或数字或下划线或汉字 s 匹配任意空白字符，包括空格、制表符，换行符、中文全角空格 d 匹配数字 b 匹配单词的开始或

正则表达式是描述某些复杂字符串规则的工具，它是记录文本规则的代码。

为了避免重复输入，可以使用{数字}表示重复的次数，如：d{8}表示d必须连续重复匹配8次

转义字符

如果想查找元字符本身的话，比如查找.或者*就出现了问题，因为它们会被解释成别的意思，可以使用来取消这些字符的特殊意义。如：.和*，或者。

重复

字符类

想查找数字、字母和空白是很简单的，因为已经有了对应这些字符集合的与字符，但是如果你想匹配没有预定义元字符的字符集合，但是如果想匹配没有预定义的元字符集合，改怎么办？只需在方括号里将它们列出就行，如：[aeiou]就匹配任何一个英文元音字母，[.?!]匹配标点符号（.或?或!)。

也可以指定一个字符范围，如：[a-z0-9A-Z_]

分枝条件

正则表达式里的分枝条件指的是有几种规则，如果满足其中任意一种规则都应该当成匹配，具体方法是用|把不同的规则分隔开。

分组

用小括号来指定字表达式（也叫做分组），然后就可以指定这个字表达式的重复次数了。

反义

有时候需要查找不属于某个能简单定义字符类的字符，需要用到反义。

后向引用

使用小括号指定一个字表达式后，匹配这个字表达式的文本（也就是此分组捕获的内容）可以在表达式或其他程序中做进一步处理。默认情况下，每个分组或自动拥有一个组号，规则是：从左向右，以分组的左括号为标识，第一个出现的分组组号为1，第二个为2，以此类推

后向引用用于重复搜索前面某个分组匹配文本如：1代表分组1匹配的文本。如：b(w+)bs+1b可以用来匹配重复的单词

也可以自己指定字表达式的组名，语法为：(?<Word>w+)或者吧尖括号换成'也行，这样就把w+指定为Word了，要反响引用这个分组捕获的内容，你可以使用=k<Word>

常用分组语法
分类	代码/语法	说明
捕获	（exp）	匹配exp,并捕获文本到自动命名的组里
捕获	(?<name>exp	匹配exp，并捕获文本到名词为name的组里，也可以写成(?'name'exp)
捕获	(?:exp)	匹配exp，不捕获匹配文本，也不给词分组分配组号
零宽断言	(?=exp)	匹配exp前面的位置
零宽断言	(?<=exp)	匹配exp后面的位置
零宽断言	(?!=exp)	匹配后面跟的不是exp的位置
零宽断言	(<!exp)	匹配前面不是exp的位置
注释	(?#comment)	这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读。

零宽断言：用于查找某些内容（但并不包括这些内容）之前或之后的东西，也就是说他们b,^,$那样用于指定一个位置，这个位置应该满足一定的条件（即断言）

负向零宽断言：用于想要确保某个字符没有出现，但并不想去匹配它。它只匹配一个位置，并不消费任何字符。

零宽度负预测先行断言(?!exp)：断言此位置后面不能匹配表达式exp

零宽度负回顾后发断言(?<!exp)：断言此位置的前面不能匹配表达式exp

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!