正则表达式30分钟入门教程

发布时间：2020-12-13 19:38:45 所属栏目：百科来源：网络整理

导读：正则表达式30分钟入门教程 http://deerchao.net/tutorials/regex/regex-1.htm .匹配除换行符以外的任意字符 *匹配重复任意次(可能是0次) +匹配重复1次或更多次。 ^匹配字符串的开始 $匹配字符串的结束 b匹配单词的开始或结束 w匹配字母或数字或下划线或汉

正则表达式30分钟入门教程

http://deerchao.net/tutorials/regex/regex-1.htm

.匹配除换行符以外的任意字符 *匹配重复任意次(可能是0次) +匹配重复1次或更多次。 ^匹配字符串的开始 $匹配字符串的结束 b匹配单词的开始或结束 w匹配字母或数字或下划线或汉字 ss匹配任意的空白符，包括空格，制表符(Tab)，换行符，中文全角空格等 d匹配数字 .*任意数量的不包含换行的字符 0d{2}-d{8}以0开头，然后是两个数字，然后是一个连字号“-”，最后是8个数字;前面d 必须连续重复匹配2次(8次)。 baw*b以字母a开头的单词——先是某个单词开始处(b)，然后是字母a,然后是任意数量的字母或数字(w*)，最后是单词结束处(b)。 d+匹配1个或更多连续的数字 bw{6}b 匹配刚好6个字符的单词。 ^d{5,12}$一个网站如果要求你填写的QQ号必须为5位到12位数字时。有些正则表达式处理工具还有一个处理多行的选项。如果选中了这个选项，^和$的意义就变成了匹配行的开始处和结束处。正则表达式引擎通常会提供一个“测试指定的字符串是否匹配一个正则表达式”的方法，如JavaScript里的RegExp.test()方法或.NET里的Regex.IsMatch()方法。这里的匹配是指是字符串里有没有符合表达式规则的部分。如果不使用^和$的话，对于d{5,12} 而言，使用这样的方法就只能保证字符串里包含5到12连续位数字，而不是整个字符串就是5到12位数字。字符转义： .和*，例如：deerchao.net匹配deerchao.net，C:Windows匹配C:Windows。重复 *重复零次或更多次 +重复一次或更多次 ?重复零次或一次 {n}重复n次 {n,}重复n次或更多次 {n,m}重复n到m次 Windowsd+匹配Windows后面跟1个或更多数字 ^w+匹配一行的第一个单词(或整个字符串的第一个单词，具体匹配哪个意思得看选项设置) 字符类 “(”和“)”也是元字符如果你想匹配没有预定义元字符的字符集合-----你只需要在方括号里列出它们就行了 [aeiou]就匹配任何一个英文元音字母， [.?!]匹配标点符号(.或?或!)。指定一个字符范围 [0-9]代表的含意与d就是完全一致的：一位数字。 [a-z0-9A-Z_]也完全等同于w（如果只考虑英文的话）：匹配一个字母或数字； (?0d{2}[) -]?d{8}可以匹配几种格式的电话号码，像(010)88886666，或022-22334455，或02912345678等。首先是一个转义字符(,它能出现0次或1次(?),然后是一个0，后面跟着2个数字(d{2})，然后是)或-或空格中的一个，它出现1次或不出现(?)，最后是8个数字 (d{8}) 分枝条件上面那个表达式也能匹配010)12345678或(022-87654321这样的“不正确”的格式。要解决这个问题，我们需要用到分枝条件。分枝条件指的是有几种规则，如果满足其中任意一种规则都应该当成匹配。 0d{2}-d{8}|0d{3}-d{7} 匹配两种以连字号分隔的电话号码：一种是三位区号，8位本地号(如010-12345678)，一种是4位区号，7位本地号(0376-2233445)。 (?0d{2})?[- ]?d{8}|0d{2}[- ]?d{8} 匹配3位区号的电话号码，其中区号可以用小括号括起来，也可以不用，((010)-12345678,) 区号与本地号间可以用连字号或空格间隔，也可以没有间隔。你可以试试用分枝条件把这个表达式扩展成也支持4位区号的。 d{5}-d{4}|d{5} 用于匹配美国的邮政编码。美国邮编的规则是5位数字，或者用连字号间隔的 9位数字。使用分枝条件时，要注意各个条件的顺序。如果你把它改成d{5}|d{5}-d{4}的话，那么就只会匹配5位的邮编(以及9位邮编的前5位)。原因是匹配分枝条件时，将会从左到右地测试每个条件，如果满足了某个分枝的话，就不会去再管其它的条件了。使用分枝条件时，要注意各个条件的顺序-----将会从左到右地测试每个条件，如果满足了某个分枝的话，就不会去再管其它的条件了。 |-------------符号分开的表达式只要一个满足，就不看后面的表达式了分组重复单个字符（直接在字符后面加上限定符就行了） ((2[0-4]d|25[0-5]|[01]?dd?).){3} (2[0-4]d|25[0-5]|[01]?dd?) 2[0-4]d------匹配类似249的，中间可以为0-4； 25[0-5]------匹配类似255的，最后为只能为0-5； [01]?dd?----匹配类似019,99等的； {3}------------前面分组，重复3次；反义常用的反义代码 W匹配任意不是字母，数字，下划线，汉字的字符 S匹配任意不是空白符的字符 D匹配任意非数字的字符 B匹配不是单词开头或结束的位置 [^x]匹配除了x以外的任意字符 [^aeiou]匹配除了aeiou这几个字母以外的任意字符 S+匹配不包含空白符的字符串。 <a[^>]+>匹配用尖括号括起来的以a开头的字符串。后向引用 http://deerchao.net/tutorials/regex/regex.htm ^#(.*)$ -------1-----去掉每行开头的# b(.*)b----#1-----每行开头添加# ^(.*)$----#1-------只在空白行，添加# ^w*$-----------每行末尾 "[0-9a-zA-Z]{14,16}----------------查找指定范围的的id，如"id" : "a15167c84cb858e"；

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!