在使用grep、awk和sed命令时,需要使用正则表达式。 比如我通过grep找代码编译结果中是否有错误。或者是否有我代码的错误。 这里说下正则表达式基本的应用:
? 匹配行首与行尾。 ? 匹配数据集。 ? 只匹配字母和数字。 ? 匹配一定范围内的字符串集。
?
^ |
只匹配行首 |
$ |
只匹配行尾 |
* |
一个单字符后紧跟*,匹配0个或多个此单字符 |
[] |
匹配[]内字符,可以是一个单字符,也可以是字符序列。可以使用 - 表示[]内字符序列范围,如用[1-5]代替[12345] |
|
用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。可以使其失去应有含义。 |
. |
匹配任意单字符 |
pattern{n} |
用来匹配前面pattern出现次数。n为次数 |
pattern{n,} |
含义同上,但次数最少为n |
patter{n,m} |
含义同上,但pattern出现次数在n与m之间 |
?
-
使用句点匹配单字符
句点“.”可以匹配任意单字符。例如,如果要匹配一个字符串,以be g开头,中间夹一个
任意字符,那么可以表示为be g . n,“.”可以匹配字符串头,也可以是中间任意字符。
在ls-l命令中,可以匹配一定权限:
.. . x . . x . . x
此格式匹配用户本身,用户组及其他组成员的执行权限。
~$ ls -l |grep ...x..x..x
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
~$
- 在行首以^匹配字符串或字符序列
^只允许在一行的开始匹配字符或单词。例如,使用ls-l命令,并匹配目录。之所以可以 这样做是因为ls-l命令结果每行第一个字符是d,即代表一个目录。 ~$ ls -l |grep ^d drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
- 在行尾以$匹配字符串或字符
可以说$与^正相反,它在行尾匹配字符串或字符,$符号放在匹配单词后。假定要匹配以 单词lisp结尾的所有行,操作为: ~$ ls |grep sp$ lisp site-lisp ~$
- 使用*匹配字符串中的单字符或其重复序列
使用此特殊字符匹配任意字符或字符串的重复多次表达式。例如: 找e*m(以e开头m结束的字符串) ~$ ls | grep e*m emacs leim ~$
- 使用屏蔽一个特殊字符的含义
有时需要查找一些字符或字符串,而它们包含了系统指定为特殊字符的一个字符。什么 是特殊字符?一般意义上讲,下列字符可以认为是特殊字符: $ . ‘ " * [ ] ^ | { } + ? 例如:找以.el后缀的文件 ~/lisp$ ls | grep .el$ abbrev.el abbrevlist.el add-log.el align.el allout.el ansi-color.el apropos.el arc-mode.el array.el autoarg.el autoinsert.el autorevert.el avoid.el battery.el bindings.el bookmark.el bs.el buff-menu.el button.el calculator.el case-table.el
- 使用[]匹配一个范围或集合
使用[]匹配特定字符串或字符串集,可以用逗号将括弧内要匹配的不同字符串分开,但并 不强制要求这样做(一些系统提倡在复杂的表达式中使用逗号),这样做可以增加模式的可读 性。 使用“-”表示一个字符串范围,表明字符串范围从“-”左边字符开始,到“-”右边字 符结束。 如果熟知一个字符串匹配操作,应经常使用[]模式。 假定要匹配任意一个数字,可以使用: [0123456789] 然而,通过使用“-”符号可以简化操作: [0-9] 或任意小写字母 [a-z] 要匹配任意字母,则使用: [A-Za-z] 表明从A-Z、a-z的字母范围。 如要匹配任意字母或数字,模式如下: [A-Za-z0-9] 注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。 [^a-zA-Z] 匹配任一非字母型字符,而 [^0-9] 匹配任一非数字型字符。 通过最后一个例子,应可猜知除了使用^,还有一些方法用来搜索任意一个特殊字符。
- 使用{}匹配模式结果出现的次数使用*可匹配所有匹配结果任意次,但如果只要指定次数,就应使用{ },此模式有三种形式,即:pattern{n}匹配模式出现n次。pattern{n,}匹配模式出现最少n次。pattern{n,m}匹配模式出现n到m次之间,n,m为0 - 2 5 5中任意整数。例如格式如下:前4个字符是数字,接下来是xx,最后4个也是数字,操作如下:[0-9]{4}XX[0-9]{4}具体含义如下:1)匹配数字出现4次。2)后跟代码xx。3)最后是数字出现4次。
(编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|