正则表达式基础篇
正则表达式基础篇 正则表达式的函数库: 1. PCRE,与Perl语言兼容的正则表达式函数。 2. POSIX。 【语法规则】 一.原子: 1) 普通字符作为原子 包括大写小写字母,所有的数字。 2) 一些特殊字符和元字符作为原子 有特殊意义的字符可以使用/转义。 3) 一些非打印字符作为原子 非打印字符就是在字符串中的格式控制符号,不可显示的。 正则表达式中常见的非打印字符
注意: ‘/n/’—在windows系统中匹配字符串中是否有回车出现。 ‘/rn/’—在Linux系统中用于匹配字符串中是否有回车。 4) 使用通用字符类型作为原子 正则表达式中常见的通用字符类型
5) 自定义原子表([])作为原子 使用原子表可以定义一组彼此地位平等的原子,例如: ‘/[ja]sp/’ –可以匹配asp和jsp两种。 二.元字符 所谓元字符就是用于构建正则表达式的具有特殊含义的字符,例如:’*’,’、’,’+’,’?’等。 元字符不能单独出现,是用来修饰原子的,可使用进行转义,使其失去特殊意义。 正则表达式的元字符
1. 限定符 限定符用来指定正则表达式的一个给定原子必须要出现多少次才能满足匹配。有“*”,“+”,“?”,“{n}”,“{n,}”,“{n,m}”六种限定符,他们之间主要的区别就是重复匹配的次数不同。 2. 边界限制 用来限定字符串或单词的边界范围,以获得更准确的匹配结果。元字符“^和$分别指字符串的开始和结束”,而“b”用于描述字符串中每个单词的前或后界。 3. 句号 .可匹配目标中的任意一个字符,包括不可打印字符。 4. 模式选择符(|) “|”选择符优先级最低,用来分隔多选一模式。 5. 模式单元 使用元字符“()”将多个原子组成大的原子,当作一个独立的单元使用 。 三.模式修正符 模式修正符号:
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |