正则表达式详解
正则表达式 正则表达式(或称Regular Expression,简称RE)就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。 该模式描述在查找文字主体时待匹配的一个或多个字符串。 正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。简单的说,正则表示式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表示式通过一些特殊符号的辅助,可以让使用者轻易的达到搜寻/删除/取代某特定字符串的处理程序。vim、grep、find、awk、sed等命令都支持正则表达式。 常用正则表达式: 1、.代表任意单个字符,如:/l..e/与包含一个l,后跟两个字符,然后跟一个e的行相匹配 ? 匹配零个或一个字符。如:'gr?p'匹配gr后跟一个或没有字符,然后是p的行 2、^代表行的开始。 ^love 如:与所有love开头的行匹配 3、$代表行的结束。love$ 如:与所有love结尾的行匹配 那么‘^$’ 就表示空行 4、[…]匹配括号中的字符之一 [abc]匹配单个字符a或b或c [123]匹配单个字符1或2或3 [a-z]匹配小写字母a-z之一 [a-zA-Z]匹配任意英文字母之一 [0-9a-zA-Z]匹配任意英文字母或数字之一 注意:上面标红色的单个和之一,不管[]里面多复杂,它的结果都是一个字符! 可以用^标记做[]内的前缀,表示除[]内的字符之外的字符。比如搜索oo前没有g的字符串的行. 应用 '[^g]oo' 作搜索字符串,^符号如果出现在[]的起始位置表示否定,但是在[]的其他位置是普通字符。[^ab^c] 匹配b或^或c或不是a的任意单个字符 5、* 用于修饰前导字符,表示前导字符出现0次或任意多次 如:'a*grep'匹配所有0个或多个a后紧跟grep的行。“.*”表示任意字符串 6、?用于修饰前导字符,表示前导字符出现0或1次 a? 匹配0或1个a 7、+用于修饰前导字符,表示前导字符出现1或多次 a+ 匹配1或多个a 8、{n,m}用于修饰前导字符,表示前导字符出现n至m次 (n和m都是整数,且n<m) a{3,5} 匹配3至5个连续的a {n,m}还有其他几种形式: {n}连续的n个前导字符 {n,}连续的至少n个前导字符 9、用于转义紧跟其后的单个特殊字符,使该特殊字符成为普通字符 如:^.[0-9][0-9]对以一个句点和两个数字开始 例如: a* 匹配连续的任意(也包括0)个a a? 匹配0或1个a a+ 匹配1或多个a a{3,5} 匹配3至5个连续的a .* 匹配0或多个连续的. .表示普通字符句点 10、|表示或如:a|b|c 匹配a或b或c。如:grep|sed匹配grep或sed 11、(),将部分内容合成一个单位组,比如要搜索 glad 或 good可以如下 'g(la|oo)d' 综合举例1: 1 Christian Scott lives here and will put ona Christmas party. 2 There are around 30 to 35 people invited. 3 They are: 4 Tom 5 Dan 6 Rhonda Savage 7 Nicky and Kimerly. 8 Steve,Suzanne,Ginger and Larry. ^[A-Z]..$ 搜索行以A至Z的一个字母开头,然后跟两个任意字母,然后跟一个换行符的行。将找到第5行。 ^[A-Z][a-z]*3[0-5] 搜索以一个大写字母开头,后跟0个或多个小写字母,再跟数字3,再跟0―5之间的一个数字。无法找到匹配行(改成^[A-Z][a-z]*.*3[0-5]可找到第2行) ^ *[A-Z][a-z][a-z]$ 搜索以0个或多个空格开头,跟一个大写字母,两个小写字母和一个换车符。将找到第4行的TOM(整行匹配)和第5行。注意,*前面有一个空格。 ^[A-Za-z]*[^,][A-Za-z]*$ 将查找以0个或多个大写或小写字母开头,不跟逗号,然后跟0个或多个大写或小写字母,然后跟一个换车符。将找到第4和5行。 综合举例2: # ls -l /bin | grep '^...s' 上面的命令是用来查找suid文件的; # ls -lR /usr | grep '^...s..s' 上面的命令是用来查找suid和guid的。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |