正则表达式
今天我将正则表达式的学习心得写出来和大家一起分享,请大家多多指点 要学习一件事情之前,必须要知道它是什么?有什么作用?这些作用能为我们带来什么?知道了这三点之后,再去学习它 正则表达式RegularEXPression,简写为REGEXP 正则表达式:是用来描述某些复杂规则的工具,记录文本规则的代码;由一些不表示自身意思的源代码组成;可以使得管理员的工作量大大减小,速度更快,效率更高;使得我们的计算机变得更智能;而正则表达式的实现一般借助三种文本处理工具:grep,sed,awk,今天我们以grep为例学习正则表达式的使用: 基本正则表达是的元字符有: .:匹配任意单个字符 []:匹配中括号范围以内的字符 [^]:只匹配中括号范围以外的字符 ^:匹配以其后面字符为开头的行 $:匹配以其前面字符为结尾的行 ^$:匹配空白行 b*b:匹配某个确定单词,也可以表示匹配以*开头或结尾的单词(此时*表示任 意字符) *:匹配前面字符任意次 {m,n}:匹配起前面字符最少m次,最多n次 +:重复前面字符至少一次,多则不限 ():匹配小括号内的内容,且支持后向引用(引用时如果只有一个分组,则只用在后边添写n即可,如果有多个分组,则需要表明) :逃字符,显示元字符本身的意思; .:此时只表示字符“.”而不是任意单个字符 使用正则表达式查找文件时的命令格式为: grep[optinos]PATTERNfilename命令+[参数]+模式+文件 实例:#grep“r..t”/etc/passwd 表示匹配文件passwd中以r开头中间是两个任意字符,以t结尾的字符串 #grep“[0-9]”/etc/passwd。。。。。。。。。。。。中括号和范围之间可有空格,也可没有 匹配文件passwd中0-9中的任意字符 #grep“[^0-9]”/etc/passwd。。。。。。。。。。。。此时中括号和^及范围之间没有空格 匹配文件passwd中除了0-9以外的任意字符 #grep“^root”/etc/passwd 匹配文件中以字符root开头的行(此时显示时只突出显示匹配行中开头的字符) #grep“bash$”/etc/passwd 匹配文件中以字符bash结尾的行(显示时只突出显示匹配行中结尾的字符) #grep“^$”/etc/inittab 匹配文件inittab中的空白行 #grep“buser1b”/etc/passwd 只匹配文件passwd中的单词user1(显示时只突出显示匹配到的行中匹配单词) #grep“b.*h”/etc/passwd 匹配文件passwd中以b开头后边跟任意个字符,并且以h结尾的字符串 #grep“ro{1,2}t”/etc/passwd 匹配文件passwd中任何以r开头,中间有一个或者两个o,以t结尾的字符 (此时前面的字符为o,而大括号内的数字为1,2,所以只重复前面字符o 至少一次,最多两次。次数匹配还可以写为{1,},重复前面字符最少一次, 多则不限;{0,9}重复前面字符至少零次,最多九次,此时前面必须写零) #grep“ro+t”/etc/passwd 匹配文件中以含有r和t,中间至少一个o的字符串 #grep“(user).*1”/etc/passwd 匹配文件passwd文件中含有user后面跟任意字符并且以user结尾的行 n表示引用前面分组字符n次 #grep“/bin/bash”/etc/passwd 匹配文件passwd中含有/bin/bash的行,此时/只表示路径 正则表达式支持的字符集: [:space:]空白字符的集合 [:digit:]所有数字的集合 [:lower:]所有小写字母的集合 [:upper:]所有大写字母的集合 [:alpha:]所有大小写字母的集合 [:alnum:]所有数字的集合 [:punct:]所有标点符号的集合 实例:#gerp“[[:space:]]*[[:lower:]]*[[:digit:]]”/etc/inittab 匹配文件inittab中所有含有任意个空白字符,之后跟任意个小写字母,在跟数字的字符串 我们在使用grep进行文件查找匹配时,往往加入一些参数,使得我们的查找更加精确,这些参数有: -i查找字符时不区分大小写 -v显示不包括匹配模式的所有内容 -o只显示搜索到的内容 --color将搜索到的内容以高亮颜色显示(默认为红色) -n显示搜索到的内容时显示行号 -An显示搜索到的内容时,顺便显示这一行下边n行,每一组之间以“--”隔开 -Bn显示搜索到的内容时,显示这一行上边n行 -Cn显示搜索到的内容时,显示这一行上边和下边各n行 -E使用扩展正则表达式,egrep==grep-E 实例: #grep-iv“bash”/etc/passwd 查找文件passwd中含有bash字符串的行,不管大小写,并且只显示没有匹配到的行 #grep-io“bash”/etc/passwd 查找文件passwd中含有bash的行,不管大小写,并且只将匹配到的行显示出来 #grep--color“^root”/etc/passwd 查找文件passwd中所有以root开头的行,并将匹配到的字符串以高亮颜色显示 #grep--color-ion“user”/etc/paswd 查找文件passwd中所有含有user的行,不管大小写,只以高亮颜色显示匹配到的字符 串,并且显示这些字符串所在的行的行号 #grep-iA3“^root”/etc/passwd 查找文件passwd中所有以root开头的行,不管大小写,并将这一行以下三行显示出来 #grep-iB3“bash$”/etc/passwd 查找文件passwd中所有以bash结尾的行,不管大小写,并将这些行的上边三行显示出来,每一个被匹配到的行显示一段,中间以“--”隔开 #grep-ic2“halt$”/etc/passwd 查找文件passwd中以halt结尾的行,并将这一行上边两行和下边两行都显示出来 扩展正则表达式:当我们要查找某一特定字符串的时候我们使用基本正则表达式即可完成任务,但是我们有时候并不确定索要查找的字符串是什么样的,如要搜索bash或halt或sync,此时三个字符串之间的关系是或,而不是和,这个时候我们就要使用扩展正则表达式! 扩展正则表达式的元字符和基本正则表达式相同,只是多了几个 ?匹配其前面字符一次或者零次,表示前面字符可有可无 |匹配字符串一或者字符串二 ()将括号内的内容视为一个整体 实例: #egrep“ro?t”/etc/passwd 匹配文件passwd中含有字符串root或者rot的行 #egrep“root|bin”/etc/passwd 匹配文件passwd中含有字符串root或者bin的行 #egrep“r(oo|ou)t”/etc/passwd 匹配文件passwd中含有字符串root或者rout的行 文字查找还有fgrep,快速文本查找,但不支持正则表达式,如果在查找文本时不打算使用元字符,建议使用fgrep进行查找! (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |