“正则表达式是描述一组字符串特征的模式,用来匹配特定的字符串。”--Ken Thompson
Regexpal网站(http://www.regexpal.com)
※字符串字面值(string literal)
※[0-9]
正则表达式[0-9]对正则表达式处理器传递的信息是“匹配0到9范围内的任意数字”。
正则表达式将方括号视为特殊的元字符(metacharacter),因此方括号不参与匹配。元字符是在正则表达式中有特殊含义的字符, 也是保留字符。[0-9]这种形式的正则表达式称做字符组(character class),有时也叫字符集(character set)。
※[0-9]→进一步限定 可以对数字的范围进行进一步了限定。用更具体的一组数字也能得到同样的结果,比如:
[012789]
这个字符组只会匹配列出的数字,即0、1、2、7、8、9。
要匹配任意10位以连字符分隔的北美电话号码,可以使用以下正则表达式。
[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]
※使用字符组简写式
d 可以像[0-9]一样匹配任意阿拉伯数字。这种正则表达式叫做字符组简写式(character shorthand),也叫转义字符(character escape)。
ddd-ddd-dddd
也可以以连字符分隔的北美电话号码。
D它匹配任何一个非数字字符 dddDdddDdddd
也可以以连字符分隔的北美电话号码。
※匹配任意字符
还可以用点号(.)来匹配那些讨厌的连字符: ddd.ddd.dddd
也可以以连字符分隔的北美电话号码。
点号(英文句号)是一个通配符,可以匹配任意字符(但某些情况下不能匹配行起始符)。 以上示例中的正则表达式匹配了连字符,但它也可以匹配百分号(%):
707%827%7019
或者是竖线(|):
707|827|7019
※捕获分和后向引用
使用捕获分组(capturing group)来匹配电话号码中的某一部分。然后使用后向引用(backreference)对分组中的内容进行引用。
要创建捕获分组,先将一个d放在一对圆括号中,这样就将它放入了一个分组中, 后面可以用l来对捕获的内容进行后向引用: (d)dl l对括号内分组捕获的内容进行了反向引用。这个正则表达式匹配的是区号707。 以下是对该表达式的详细分析: ●(d)匹配第一个数字并将其捕获(数字7); ●d匹配第二个数字(数字0)但没有捕获,因为没有括号; ●l对捕获的数字进行反向引用(数字7)。
(d)0lDddlDlddd (编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|