正则表达式

发布时间：2020-12-13 19:48:50 所属栏目：百科来源：网络整理

导读：一. 正则表达式常用字符：元字符说明 . 匹配除换行符以外的任意字符 w 匹配字母或数字或下划线或汉字 s 匹配任意的空白符 d 匹配数字 b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束限定符 * 重复零次或更多次 + 重复一次或更多次 ?

一. 正则表达式常用字符：

元字符	说明
.	匹配除换行符以外的任意字符
w	匹配字母或数字或下划线或汉字
s	匹配任意的空白符
d	匹配数字
b	匹配单词的开始或结束
^	匹配字符串的开始
$	匹配字符串的结束
限定符
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次
[]	匹配范围
\|	分支条件，从左向右匹配
反义代码
W	匹配任意不是字母，数字，下划线，汉字的字符
S	匹配任意不是空白符的字符
D	匹配任意非数字的字符
B	匹配不是单词开头或结束的位置
[^x]	匹配除了x以外的任意字符
[^aeiou]	匹配除了aeiou这几个字母以外的任意字符
分组语法
(exp)	匹配exp,并捕获文本到自动命名的组里
(?<name>exp)	匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)
(?:exp)	匹配exp,不捕获匹配的文本，也不给此分组分配组号
(?=exp)	匹配exp前面的位置
(?<=exp)	匹配exp后面的位置
(?!exp)	匹配后面跟的不是exp的位置
(?<!exp)	匹配前面不是exp的位置
(?#comment)	这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读
懒惰限定符
*?	重复任意次，但尽可能少重复
+?	重复1次或更多次，但尽可能少重复
??	重复0次或1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复
{n,}?	重复n次以上，但尽可能少重复
其它
a	报警字符(打印它的效果是电脑嘀一声)
b	通常是单词分界位置，但如果在字符类里使用代表退格
t	制表符，Tab
r	回车
v	竖向制表符
f	换页符
n	换行符
e	Escape
nn	ASCII代码中八进制代码为nn的字符
xnn	ASCII代码中十六进制代码为nn的字符
unnnn	Unicode代码中十六进制代码为nnnn的字符
cN	ASCII控制字符。比如cC代表Ctrl+C
A	字符串开头(类似^，但不受处理多行选项的影响)
Z	字符串结尾或行尾(不受处理多行选项的影响)
z	字符串结尾(类似$，但不受处理多行选项的影响)
G	当前搜索的开头
p{name}	Unicode中命名为name的字符类，例如p{IsGreek}
(?>exp)	贪婪子表达式
(?<x>-<y>exp)	平衡组
(?im-nsx:exp)	在子表达式exp中改变处理选项
(?im-nsx)	为表达式后面的部分改变处理选项
(?(exp)yes\|no)	把exp当作零宽正向先行断言，如果在这个位置能匹配，使用yes作为此组的表达式；否则使用no
(?(exp)yes)	同上，只是使用空表达式作为no
(?(name)yes\|no)	如果命名为name的组捕获到了内容，使用yes作为表达式；否则使用no
(?(name)yes)	同上，只是使用空表达式作为no

二. 正则表达式常用实例：

1.验证用户名和密码：（"^[a-zA-Z]w{5,15}$"）正确格式："[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位； 2.验证电话号码：（"^(d{3.4}-)d{7,8}$"）正确格式：xxx/xxxx-xxxxxxx/xxxxxxxx； 3.验证手机号码："^1[3|4|5|8][0-9]d{8}$" 4.验证身份证号（15位或18位数字）："d{17}[[0-9],0-9xX]"； 5.验证Email地址：("^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$")； 6.只能输入由数字和26个英文字母组成的字符串：("^[A-Za-z0-9]+$"); 7.整数或者小数：^[0-9]+.{0,1}[0-9]{0,2}$ 8.只能输入数字："^[0-9]*$"。 9.只能输入n位的数字："^d{n}$"。 10.只能输入至少n位的数字："^d{n,}$"。 11.只能输入m~n位的数字：。"^d{m,n}$" 12.只能输入零和非零开头的数字："^(0|[1-9][0-9]*)$"。 13.只能输入有两位小数的正实数："^[0-9]+(.[0-9]{2})?$"。 14.只能输入有1~3位小数的正实数："^[0-9]+(.[0-9]{1,3})?$"。 15.只能输入非零的正整数："^+?[1-9][0-9]*$"。 16.只能输入非零的负整数："^-[1-9][]0-9"*$。 17.只能输入长度为3的字符："^.{3}$"。 18.只能输入由26个英文字母组成的字符串："^[A-Za-z]+$"。 19.只能输入由26个大写英文字母组成的字符串："^[A-Z]+$"。 20.只能输入由26个小写英文字母组成的字符串："^[a-z]+$"。 21.验证是否含有^%&',;=?$"等字符："[^%&',;=?$x22]+"。 22.只能输入汉字："^[u4e00-u9fa5]{0,}$" 23.验证URL："^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$"。 24.验证一年的12个月："^(0?[1-9]|1[0-2])$"正确格式为："01"～"09"和"1"～"12"。 25.验证一个月的31天："^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为；"01"～"09"和"1"～"31"。 26.获取日期正则表达式：d{4}[年|-|.]d{1-12}[月|-|.]d{1-31}日? 评注：可用来匹配大多数年月日信息。 27.匹配双字节字符(包括汉字在内)：[^x00-xff] 评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1） 28.匹配空白行的正则表达式：ns*r 评注：可以用来删除空白行 29.匹配HTML标记的正则表达式：<(S*?)[^>]*>.*?</>|<.*?/> 评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为力 30.匹配首尾空白字符的正则表达式：^s*|s*$ 评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式 31.匹配网址URL的正则表达式：[a-zA-z]+://[^s]* 评注：网上流传的版本功能很有限，上面这个基本可以满足需求 32.匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 评注：表单验证时很实用 33.匹配腾讯QQ号：[1-9][0-9]{4,} 评注：腾讯QQ号从000 0 开始 34.匹配中国邮政编码：[1-9]d{5}(?!d) 评注：中国邮政编码为6位数字 35.匹配ip地址：((2[0-4]d|25[0-5]|[01]?dd?).){3}(2[0-4]d|25[0-5]|[01]?dd?)。

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!