加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则表达式说明

发布时间:2020-12-13 22:41:28 所属栏目:百科 来源:网络整理
导读:qt里 \ == w ==w 本文中// ==/ /w==/w 目前,正则表达式已经在很多软件中得到广泛的应用,包括 *nix ( Linux,Unix 等), HP 等操作系统, PHP , C# , Java 等开发环境,以及很多的应用软件中,都可以看到正则表达式的影子。 正则表达式的使用,可

qt里 \ ==

w ==w

本文中// ==/

/w==/w


目前,正则表达式已经在很多软件中得到广泛的应用,包括*nixLinux,Unix等),HP等操作系统,PHPC#Java等开发环境,以及很多的应用软件中,都可以看到正则表达式的影子。

正则表达式的使用,可以通过简单的办法来实现强大的功能。为了简单有效而又不失强大,造成了正则表达式代码的难度较大,学习起来也不是很容易,所以需要付出一些努力才行,入门之后参照一定的参考,使用起来还是比较简单有效的。

正则表达式可以:
1.测试字符串的某个模式,例如可以对一个输入字符串进行测试,看该字符串是否存在一个电话号码的模式,这称为数据有效性验证
2.替换文本,可以在文档中使用一个正则表达式来标识特定文字,然后可以全部将其删除,或者替换为别的文字
3.根据模式匹配从字符串中提取一个子字符串,可以用来在文本或输入字段中查找特定文字

正则表达式的常用字符及其含义

正则表达式字符

描述

[……]

匹配括号中的任何一个字符

[^……]

匹配不在括号中的任何一个字符(^为取反符)

/w

匹配任何一个字符(a~zA~Z0~9

/W

匹配任何一个空白字符

/s

匹配任何一个非空白字符

/S

与任何非单词字符匹配

/d

匹配任何一个数字(0~9

/D

匹配任何一个非数字(^0~9

[/b]

匹配一个退格键字母

{n,m}

最少匹配前面表达式n次,最大为m(n-m次数范围)

{n,}

最少匹配前面表达式n(上限不定)

{n}

恰恰匹配前面表达式为n

?

匹配前面表达式01次,即{0,1}

+

至少匹配前面表达式1次,即{1,}

*

至少匹配前面表达式0次,即{0,}

|

匹配前面表达式或后面表达式(逻辑或)

(…)

在单元中组合项目

^

匹配字符串的开头

$

匹配字符串的结尾

/b

匹配字符边界

/B

匹配非字符边界的某个位置

几个常用的正则表达式

·/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*验证电子邮件:

HTTP///S+//S+验证网址:

/d{6}验证邮政编码:

[0-9]表示0~9十个数字。

/d*表示任意个数字。

/d{3,4}-/d{7,8}表示中国大陆的固定电话号码。

/d{2}-/d{5}验证由两位数字、一个连字符再加5位数字组成的ID号。

</s*(/S+)(/s[^>]*)?>[/s/S]*</s*///l/s*>匹配HTML标记。

/d{17}[/d|X]|/d{15}身份证


字符描述:

/:将下一个字符标记为特殊字符或字面值。例如"n"与字符"n"匹配。"/n"与换行符匹配。序列"//""/"匹配,"/(""("匹配。
^:匹配输入的开始位置。
$:匹配输入的结尾。
*:匹配前一个字符零次或几次。例如,"zo*"可以匹配"zo""zoo"
+:匹配前一个字符一次或多次。例如,"zo+"可以匹配"zoo",但不匹配"z"
?:匹配前一个字符零次或一次。例如,"n?ve?"可以匹配"never"中的"ve"
.:匹配换行符以外的任何字符。
(pattern)与模式匹配并记住匹配。匹配的子字符串可以从作为结果的

Matches集合中使用Item[0]...[n]取得。如果要匹配括号字符(),可使用"/(""/)"
x|y:匹配xy。例如"z|food"可匹配"z""food""(z|f)ood"匹配"zood""food"
{n}n为非负的整数,匹配恰好n次。例如,"o{2}"不能与"Bob中的"o"匹配,但是可以与"foooood"中的前两个o匹配。
{n,}n为非负的整数,匹配至少n次。例如,"o{2,}"匹配"foooood"中所有的o"o{1,}"等价于"o+""o{0,}"等价于"o*"
{n,m}mn为非负的整数。匹配至少n次,至多m次。例如,"o{1,3}"匹配"fooooood"中前三个o"o{0,1}"等价于"o?"
[xyz]:一个字符集,与括号中字符的其中之一匹配。例如,"[abc]"匹配"plain"中的"a"
[^xyz]:一个否定的字符集,匹配不在此括号中的任何字符。例如,"[^abc]"可以匹配"plain"中的"p".
[a-z]:表示某个范围内的字符,与指定区间内的任何字符匹配。例如,"[a-z]"匹配"a""z"之间的任何一个小写字母字符。
[^m-z]:否定的字符区间,与不在指定区间内的字符匹配。例如,"[m-z]"与不在"m""z"之间的任何字符匹配。
/b:与单词的边界匹配,即单词与空格之间的位置。例如,"er/b""never"中的"er"匹配,但是不匹配"verb"中的"er"
/B:与非单词边界匹配,"ea*r/B""neverearly"中的"ear"匹配。
/d:与一个数字字符匹配,等价于[0-9]
/D:与非数字的字符匹配,等价于[^0-9]
/f:与分页符匹配。
/n:与换行符字符匹配。
/r:与回车字符匹配。
/s:与任何白字符匹配,包括空格、制表符、分页符等。等价于"[/f/n/r/t/v]"
/S:与任何非空白的字符匹配,等价于"[^/f/n/r/t/v]"
/t:与制表符匹配。
/v:与垂直制表符匹配。
/w:与任何单词字符匹配,包括下划线。等价于"[A-Za-z0-9_]"
/W:与任何非单词字符匹配,等价于"[^A-Za-z0-9_]"
/num:匹配num个,其中num为一个正整数,引用回到记住的匹配。例如,"(.)/1"匹配两个连续的相同的字符。
/n:匹配n,其中n是一个八进制换码值。八进制换码值必须是1,23个数字长。

例如,"/11""/011"都与一个制表符匹配。"/0011"等价于"/001""1"。八进制换码值不得超过256。否则,只有前两个字符被视为表达式的一部分。允许在正则表达式中使用ASCII码。
/xn:匹配n,其中n是一个十六进制的换码值。十六进制换码值必须恰好为两个数字长。例如,"/x41"匹配"A""/x041"等价于"/x04""1"。允许在正则表达式中使用ASCII码。

好了,现在我们就举个例子来说明正则表达式的使用,以验证邮件。例如我们输入:test@yesky.com,当然我也会这样输入:xxx@yyy.com.cn;但是这样的则是非法,如:xxx@@com.cn或者@xxx.com.cn,等等,所以我们得归纳出合法的电子邮件地址应满足的条件:
1.必须包含一个并且只有一个符号“@”
2.第一个字符不得是“@”或者“.”
3.不允许出现“@.”或者.@
4.结尾不得是字符“@”或者“.”
根据以上的原则,我们就可以得到如下的模板:"^/w+((-/w+)|(/./w+))*/@[A-Za-z0-9]+((/.|-)[A-Za-z0-9]+)*/.[A-Za-z0-9]+$"

接着,我们对其改进,可以得到这样的模板格式:"/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*"

正则表达式的常见用法

"^/d+$":非负整数(正整数+0

"^[0-9]*[1-9][0-9]*$":正整数

"^((-/d+)|(0+))$":非正整数(负整数+0

"^-[0-9]*[1-9][0-9]*$":负整数

"^-?/d+$":整数

"^/d+(/./d+)?$":非负浮点数(正浮点数+0

"^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$":正浮点数

"^((-/d+(/./d+)?)|(0+(/.0+)?))$":非正浮点数(负浮点数+0

"^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$":负浮点数

"^(-?/d+)(/./d+)?$":浮点数

"^[A-Za-z]+$":由26个英文字母组成的字符串

"^[A-Z]+$":由26个英文字母的大写组成的字符串

"^[a-z]+$":由26个英文字母的小写组成的字符串

"^[A-Za-z0-9]+$":由数字和26个英文字母组成的字符串

"^/w+$":由数字、26个英文字母或者下划线组成的字符串

"^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$"email地址

"^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$"url

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读