正则表达式的基础知识
1、正则表达式的组成 定界符、原子、元字符、模式修正符 匹配原则是从左到右
2、定界符 用于确定正则表达式字符串的边界
不能使用:a-z、A-Z、0-9、、空格 通常使用:'/正则匹配/'
3、原子 原子是正则表达式中最基本的单位
特殊原子 d:0-9 [0-9] D:除了0-9 [^0-9] w:字,a-z、A-Z、0-9、_ [a-zA-Z0-9_] W:除了字以外的字符 [^a-zA-Z0-9_] s:空白字符,空格、n、r、t等 [tnr] S 空白字符以外的字符 [^tnr] b:单词边界匹配,所有W都是词边界 B:非次边界 []:原子列表(匹配其中的任意字符) ^:用在[]内表示取反 .:任意非n字符 4、元字符 用于修饰前面的原子,对其进行限定,不能单独存在
*:任意次 +:至少1次 ?:0或1次 {}:指定次 ^:以指定字符开头 A:同上 $:以指定字符结尾 Z:同上 |:或,优先级最低 ():作为一个整体(了解,子模式)
5、模式修正符 对整个正则表达式的匹配模式进行限定
i:忽略大小写 m:多行模式 s:让点匹配n,测试时正则表达式一定要使用"",因为''中的n不解释 x:忽略正则表达式中的空格 A:必须从开头匹配,等价于^ U:取反正则中的贪婪,匹配默认是贪婪的
.+?:取消至少一次的贪婪,即只匹配1个字符 .*?:取消任意多次的贪婪,即只匹配0个字符 6、正则函数 preg_match:执行一次正则匹配 preg_match_all:执行全局正则匹配 preg_replace:匹配并替换 preg_split:通过正则表达式分割字符串 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |