精通 JS正则表达式http://www.cnblogs.com/aaronjs/archive/2012/06/30/2570970.html
正则表达式可以: ?测试字符串的某个模式。例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式。这称为数据有效性验证 ?替换文本。可以在文档中使用一个正则表达式来标识特定文字,然后可以全部将其删除,或者替换为别的文字 ?根据模式匹配从字符串中提取一个子字符串。可以用来在文本或输入字段中查找特定文字 正则表达式语法 一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。 创建正则表达式
- varre=newRegExp();
-
- re=newRegExp("a");
- newRegExp("a","i");
RegExp构造函数第一个参数为正则表达式的文本内容,而第一个参数则为可选项标志.标志可以组合使用 ?g (全文查找) ?i (忽略大小写) ?m (多行查找)
"gi");
正则表达式还有另一种正则表达式字面量的声明方式
varre=/a/gi;
和正则表达式相关的方法和属性 正则表达式对象的方法 ?test,返回一个 Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在则返回 true,否则就返回 false。 ?exec,用正则表达式模式在字符串中运行查找,并返回包<script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js"></script>含该查找结果的一个数组。 ?compile,把正则表达式编译为内部格式,从而执行得更快。 正则表达式对象的属性 ?source,返回正则表达式模式的文本的复本。只读。 ?lastIndex,返回字符位置,它是被查找字符串中下一次成功匹配的开始位置。 ?
1...
9,返回九个在模式匹配期间找到的、最近保存的部分。只读。 ?input ($_),返回执行规范表述查找的字符串。只读。 ?lastMatch ($&),返回任何正则表达式搜索过程中的最后匹配的字符。只读。 ?lastParen ($+),如果有的话,返回任何正则表达式查找过程中最后括的子匹配。只读。 ?leftContext ($`),返回被查找的字符串中从字符串开始位置到最后匹配之前的位置之间的字符。只读。 ?rightContext ($'),返回被搜索的字符串中从最后一个匹配位置开始到字符串结尾之间的字符。只读。 String对象一些和正则表达式相关的方法 ?match,找到一个或多个正则表达式的匹配。 ?replace,替换与正则表达式匹配的子串。 ?search,检索与正则表达式相匹配的值。 ?split,把字符串分割为字符串数组。 测试正则表达式是如何工作的!
//test方法,测试字符串,符合模式时返回true,否则返回false
varre=/he/;
varstr="he";
alert(re.test(str));
str="we";
//false
str="HE";
//false,大写,如果要大小写都匹配可以指定i标志(i是ignoreCase或case-insensitive的表示)
re=/he/i;
str="Certainly!Helovesher!";
//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字符,则可使用^和$
re=/^he/i;
str="Heisagoodboy!";
re=/^he$/i;
str="He";
//当然,这样不能发现正则表达式有多强大,因为我们完全可以在上面的例子中使用==或indexOf
re=/s/;
str="userName";
//用户名包含制表符
re=/^[a-z]/i;
str="variableName";
str="123abc";
//false
当然,仅仅知道了字符串是否匹配模式还不够,我们还需要知道哪些字符匹配了模式 varosVersion="Ubuntu8";
varre=/^[a-z]+s+d+$/i;
alert(re.test(osVersion));
//另一个方法exec,返回一个数组,数组的第一个元素为完整的匹配内容
re=/^[a-z]+s+d+$/i;
arr=re.exec(osVersion);
alert(arr[0]);
//我只需要取出数字
re=/d+/;
vararr=re.exec(osVersion);
//8
更复杂的用法,使用子匹配
//exec返回的数组第1到n元素中包含的是匹配中出现的任意一个子匹配
re=/^[a-z]+s+(d+)$/i;
//整个osVersion,也就是正则表达式的完整匹配
alert(arr[1]);
alert(arr.length);
osVersion="Ubuntu8.10";
re=/^[a-z]+s+(d+).(d+)$/i;
//完整的osVersion
//8
alert(arr[2]);
注意,当字符串不匹配re时,exec方法将返回null String对象的一些和正则表达式有关的方法
//replace方法,用于替换字符串
varstr="somemoney";
alert(str.replace("some","much"));
//replace的第一个参数可以为正则表达式
varre=/s/;
alert(str.replace(re,"%"));
//在不知道字符串中有多少空白字符时,正则表达式极为方便
str="somesometsometf";
re=/s+/;
"#"));
//因为一个正则表达式只能进行一次匹配,s+匹配了第一个空格后就退出了
re=/s+/g;
"@"));
//另一个与之相似的是split
varstr="a-bd-c";
vararr=str.split("-");
//如果str是用户输入的,他可能输入a-bd-c也可能输入abdc或a_bd_c,但不会是abdc(这样就说他输错了)
str="a_db-c";
re=/[^a-z]/i;
//匹配任何不在指定范围内的任意字符,这里将匹配除字母处的所有字符
arr=str.split(re);
//在字符串中查找时我们常用indexOf,与之对应用于正则查找的方法是search
str="Myageis18.Goldenage!";
alert(str.search(re));
//注意,因为查找本身就是出现第一次就立即返回,所以无需在search时使用g标志
//下面的代码虽然不出错,但g标志是多余的
re=/d+/g;
//仍然是10
类似于exec方法,String对象的match方法也用于将字符串与正则表达式进行匹配并返回结果数组 varstr="MynameisCJ.Helloeveryone!";
varre=/[A-Z]/;
vararr=str.match(re);
alert(arr);
re=/[A-Z]/g;
arr=str.match(re);
//M,C,J,H
//从字符串中抽取单词
re=/b[a-z]*b/gi;
str="onetwothreefour";
alert(str.match(re));
RegExp对象实例的一些属性
varre=/[a-z]/i;
alert(re.source);
//请注意,直接alert(re)会将正则表达式连同前向斜线与标志输出,这是re.toString方法定义的
每个RegExp对象的实例具有lastIndex属性,它是被查找字符串中下一次成功匹配的开始位置,默认值是-1。 lastIndex 属性被 RegExp 对象的 exec 和 test 方法修改.并且它是可写的.
varre=/[A-Z]/;
//exec方法执行后,修改了re的lastIndex属性,
varstr="Hello,World!!!";
vararr=re.exec(str);
alert(re.lastIndex);
arr=re.exec(str);
//1
//7
当匹配失败(后面没有匹配),或lastIndex值大于字符串长度时,再执行exec等方法会将lastIndex设为0(开始位置)
re.lastIndex=120;
//0
RegExp对象的静态属性
//input最后用于匹配的字符串(传递给test,exec方法的字符串)
alert(RegExp.input);
re.exec("tempstr");
//仍然是Hello,World!!!,因为tempstr不匹配
//lastMatch最后匹配的字符
re=/[a-z]/g;
str="hi";
re.test(str);
alert(RegExp.lastMatch);
alert(RegExp["$&"]);
//lastParen最后匹配的分组
re=/[a-z](d+)/gi;
str="Class1Class2Class3";
alert(RegExp.lastParen);
//rigthContext返回被搜索的字符串中从最后一个匹配位置开始到字符串结尾之间的字符
str="123ABC456";
alert(RegExp.leftContext);
alert(RegExp.rightContext);
alert(RegExp["$`"]);
alert(RegExp["$'"]);
multiline属性返回正则表达式是否使用多行模式,这个属性不针对某个正则表达式实例,而是针对所有正则表达式,并且这个属性可写.(IE与Opera不支持这个属性)
alert(RegExp.multiline);
//因为IE,Opera不支持这个属性,所以最好还是单独指定
varre=/w+/m;
alert(re.multiline);
alert(RegExp["$*"]);
RegExp.multiline=true;
alert(RegExp.multiline);
使用元字符注意事项:元字符是正则表达式的一部分,当我们要匹配正则表达式本身时,必须对这些元字符转义.下面是正则表达式用到的所有元字符 ( [ { ^ $ | ) ? * + .
varstr="?";
varre=/?/;
//出错,因为?是元字符,必须转义
re=/?/;
//true
使用RegExp构造函数与使用正则表达式字面量创建正则表达式注意点 varstr="?";
alert(str);
varre=/?/;
newRegExp("?");
newRegExp("?");
既然双重转义这么不友好,所以还是用正则表达式字面量的声明方式 如何在正则表达式中使用特殊字符? //ASCII方式用十六进制数来表示特殊字符
varre=/^x43x4A$/;
alert(re.test("CJ"));
re=/^103112$/;
re=/^u0043u004A$/;
alert(re.test("CJ"));
另处,还有一些其它的预定义特殊字符,如下表所示: 字符 描述 n 换行符 r 回车符 t 制表符 f 换页符(Tab) cX 与X对应的控制字符 b 退格符(BackSpace) v 垂直制表符
|