正则表达式说明

发布时间：2020-12-13 22:41:28 所属栏目：百科来源：网络整理

导读：qt里 \ == w ==w 本文中// ==/ /w==/w 目前，正则表达式已经在很多软件中得到广泛的应用，包括 *nix （ Linux,Unix 等）， HP 等操作系统， PHP ， C# ， Java 等开发环境，以及很多的应用软件中，都可以看到正则表达式的影子。正则表达式的使用，可

qt里 \ ==

w ==w

本文中// ==/

/w==/w

目前，正则表达式已经在很多软件中得到广泛的应用，包括*nix（Linux,Unix等），HP等操作系统，PHP，C#，Java等开发环境，以及很多的应用软件中，都可以看到正则表达式的影子。

正则表达式的使用，可以通过简单的办法来实现强大的功能。为了简单有效而又不失强大，造成了正则表达式代码的难度较大，学习起来也不是很容易，所以需要付出一些努力才行，入门之后参照一定的参考，使用起来还是比较简单有效的。

正则表达式可以：
1.测试字符串的某个模式，例如可以对一个输入字符串进行测试，看该字符串是否存在一个电话号码的模式，这称为数据有效性验证
2.替换文本，可以在文档中使用一个正则表达式来标识特定文字，然后可以全部将其删除，或者替换为别的文字
3.根据模式匹配从字符串中提取一个子字符串，可以用来在文本或输入字段中查找特定文字

正则表达式的常用字符及其含义

正则表达式字符	描述
[……]	匹配括号中的任何一个字符
[^……]	匹配不在括号中的任何一个字符（^为取反符）
/w	匹配任何一个字符（a~z、A~Z和0~9）
/W	匹配任何一个空白字符
/s	匹配任何一个非空白字符
/S	与任何非单词字符匹配
/d	匹配任何一个数字（0~9）
/D	匹配任何一个非数字（^0~9）
[/b]	匹配一个退格键字母
{n,m}	最少匹配前面表达式n次，最大为m次(n-m次数范围)
{n,}	最少匹配前面表达式n次(上限不定)
{n}	恰恰匹配前面表达式为n次
?	匹配前面表达式0或1次，即{0,1}
+	至少匹配前面表达式1次，即{1,}
*	至少匹配前面表达式0次，即{0,}
\|	匹配前面表达式或后面表达式（逻辑或）
(…)	在单元中组合项目
^	匹配字符串的开头
$	匹配字符串的结尾
/b	匹配字符边界
/B	匹配非字符边界的某个位置

几个常用的正则表达式

·/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*：验证电子邮件：

HTTP：///S+/．/S+：验证网址：

/d{6}：验证邮政编码：

[0-9]：表示0~9十个数字。

/d*：表示任意个数字。

/d{3,4}-/d{7,8}：表示中国大陆的固定电话号码。

/d{2}-/d{5}：验证由两位数字、一个连字符再加５位数字组成的ID号。

</s*(/S+)(/s[^>]*)?>[/s/S]*</s*///l/s*>：匹配HTML标记。

/d{17}[/d|X]|/d{15}：身份证

字符描述：

/：将下一个字符标记为特殊字符或字面值。例如"n"与字符"n"匹配。"/n"与换行符匹配。序列"//"与"/"匹配，"/("与"("匹配。
^：匹配输入的开始位置。
$：匹配输入的结尾。
*：匹配前一个字符零次或几次。例如，"zo*"可以匹配"zo"、"zoo"。
+：匹配前一个字符一次或多次。例如，"zo+"可以匹配"zoo",但不匹配"z"。
?：匹配前一个字符零次或一次。例如，"n?ve?"可以匹配"never"中的"ve"。
.：匹配换行符以外的任何字符。
(pattern)与模式匹配并记住匹配。匹配的子字符串可以从作为结果的

Matches集合中使用Item[0]...[n]取得。如果要匹配括号字符(和)，可使用"/("或"/)"。
x|y：匹配x或y。例如"z|food"可匹配"z"或"food"。"(z|f)ood"匹配"zood"或"food"。
{n}：n为非负的整数，匹配恰好n次。例如，"o{2}"不能与"Bob中的"o"匹配，但是可以与"foooood"中的前两个o匹配。
{n,}：n为非负的整数，匹配至少n次。例如，"o{2,}"匹配"foooood"中所有的o，"o{1,}"等价于"o+"；"o{0,}"等价于"o*"。
{n,m}：m和n为非负的整数。匹配至少n次，至多m次。例如，"o{1,3}"匹配"fooooood"中前三个o，"o{0,1}"等价于"o?"。
[xyz]：一个字符集，与括号中字符的其中之一匹配。例如，"[abc]"匹配"plain"中的"a"。
[^xyz]：一个否定的字符集，匹配不在此括号中的任何字符。例如，"[^abc]"可以匹配"plain"中的"p".
[a-z]：表示某个范围内的字符，与指定区间内的任何字符匹配。例如，"[a-z]"匹配"a"与"z"之间的任何一个小写字母字符。
[^m-z]：否定的字符区间，与不在指定区间内的字符匹配。例如，"[m-z]"与不在"m"到"z"之间的任何字符匹配。
/b：与单词的边界匹配，即单词与空格之间的位置。例如，"er/b"与"never"中的"er"匹配，但是不匹配"verb"中的"er"。
/B：与非单词边界匹配，"ea*r/B"与"neverearly"中的"ear"匹配。
/d：与一个数字字符匹配，等价于[0-9]。
/D：与非数字的字符匹配，等价于[^0-9]。
/f：与分页符匹配。
/n：与换行符字符匹配。
/r：与回车字符匹配。
/s：与任何白字符匹配，包括空格、制表符、分页符等。等价于"[/f/n/r/t/v]"。
/S：与任何非空白的字符匹配，等价于"[^/f/n/r/t/v]"。
/t：与制表符匹配。
/v：与垂直制表符匹配。
/w：与任何单词字符匹配，包括下划线。等价于"[A-Za-z0-9_]"。
/W：与任何非单词字符匹配，等价于"[^A-Za-z0-9_]"。
/num：匹配num个，其中num为一个正整数，引用回到记住的匹配。例如，"(.)/1"匹配两个连续的相同的字符。
/n：匹配n，其中n是一个八进制换码值。八进制换码值必须是1,2或3个数字长。

例如，"/11"和"/011"都与一个制表符匹配。"/0011"等价于"/001"与"1"。八进制换码值不得超过256。否则，只有前两个字符被视为表达式的一部分。允许在正则表达式中使用ASCII码。
/xn：匹配n，其中n是一个十六进制的换码值。十六进制换码值必须恰好为两个数字长。例如，"/x41"匹配"A"。"/x041"等价于"/x04"和"1"。允许在正则表达式中使用ASCII码。

好了，现在我们就举个例子来说明正则表达式的使用，以验证邮件。例如我们输入：test@yesky.com，当然我也会这样输入：xxx@yyy.com.cn；但是这样的则是非法，如：xxx@@com.cn或者@xxx.com.cn，等等，所以我们得归纳出合法的电子邮件地址应满足的条件：
1.必须包含一个并且只有一个符号“@”
2.第一个字符不得是“@”或者“.”
3.不允许出现“@.”或者.@
4.结尾不得是字符“@”或者“.”
根据以上的原则，我们就可以得到如下的模板："^/w+((-/w+)|(/./w+))*/@[A-Za-z0-9]+((/.|-)[A-Za-z0-9]+)*/.[A-Za-z0-9]+$"

接着，我们对其改进，可以得到这样的模板格式："/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*"

正则表达式的常见用法

"^/d+$"：非负整数（正整数+0）

"^[0-9]*[1-9][0-9]*$"：正整数

"^((-/d+)|(0+))$"：非正整数（负整数+0）

"^-[0-9]*[1-9][0-9]*$"：负整数

"^-?/d+$"：整数

"^/d+(/./d+)?$"：非负浮点数（正浮点数+0）

"^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$"：正浮点数

"^((-/d+(/./d+)?)|(0+(/.0+)?))$"：非正浮点数（负浮点数+0）

"^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$"：负浮点数

"^(-?/d+)(/./d+)?$"：浮点数

"^[A-Za-z]+$"：由26个英文字母组成的字符串

"^[A-Z]+$"：由26个英文字母的大写组成的字符串

"^[a-z]+$"：由26个英文字母的小写组成的字符串

"^[A-Za-z0-9]+$"：由数字和26个英文字母组成的字符串

"^/w+$"：由数字、26个英文字母或者下划线组成的字符串

"^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$"：email地址

"^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$"：url

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!