加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

grep与正则表达式

发布时间:2020-12-13 23:05:59 所属栏目:百科 来源:网络整理
导读:一、 grep 命令的用法 grep ( globalsearchregularexpression(RE)andprintouttheline, 全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印 出来 . 参数 : 1.-ANUM , --after-context=NUM 除了列

一、grep命令的用法

grepglobalsearchregularexpression(RE)andprintouttheline,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.

参数:

1.-ANUM--after-context=NUM除了列出符合行之外,并且列出后NUM行。

:$grep?CA1pandafile(file中搜寻有panda样式的行,并显示该行的后1)


2.-BNUM--before-context=NUM-ANUM相对,但这此参数是显示除符合行之外并显示在它之前的NUM行。:(file中搜寻有panda样式的行,并显示该行的前1)

$grep-B1pandafile


3-C[NUM],-NUM,--context[=NUM]列出符合行之外并列出上下各NUM行,默认值是2

:(列出file中除包含panda样式的行外并列出其上下2)(若要改变默认值,直接改变NUM即可)

$grep-C[NUM]pandafile


4-c,--count不显示符合样式行,只显示符合的总行数。若再加上-v,--invert-match,参数显示不符合的总行数


5-i--ignore-case忽略大小写差别


6-n--line-number在匹配的行前面打印行号


7-v--revert-match反检索,只显示不匹配的行


8、精确匹配:

例如在抽取字符串“48”,返回结果包含诸如484483等包含“48”的其他字符串,实际上应精确抽取只包含48的各行。注意在每个匹配模式中抽取字符串后有一个<Tab>键,所以应操作如下

#grep"48<tab>"filename

使用grep抽取精确匹配的一种更有效方式是在抽取字符串后加&;。假定现在精确抽取48

方法如下:

#grep'48&;'filename


9、-s不显示不存在或无匹配文本的错误信息

如:执行命令grep"root"/etc/password,因为password文件不存在,所以在屏幕上输出错误信息,若使用grep命令-s开关,可屏蔽错误信息

要用好grep这个工具,其实就是要写好正则表达式,所以这里不对grep的所有功能进行实例讲解,只列几个例子,讲解一个正则表达式的写法。
$ls-l|grep'^d'
通过管道过滤ls-l输出的内容,只显示以d开头的行。
$grep'test'd*
显示所有以d开头的文件中包含test的行。
$grep'test'aabbcc
显示在aabbcc文件中匹配test的行。
$grep'[a-z]{5,}'aa
显示所有包含每个字符串至少有5个连续小写字符的字符串的行。

$grept[a|e]stfilename

显示包含testtast的所有行。

$grep'.$'filename

显示以.为结尾的所有行。


二、正则表达式:

正则表达式(或称RegularExpression,简称RE就是由普通字符(例如字符az)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。简单的说,正则表示式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表示式通过一些特殊符号的辅助,可以让使用者轻易的达到搜寻/删除/取代某特定字符串的处理程序。vimgrepfindawksed等命令都支持正则表达式。

常用正则表达式:

1.代表任意单个字符,如:/l..e/与包含一个l,后跟两个字符,然后跟一个e的行相匹配

?匹配零个或一个字符。如:'gr?p'匹配gr后跟一个或没有字符,然后是p的行

2^代表行的开始。^love如:与所有love开头的行匹配

3$代表行的结束。love$如:与所有love结尾的行匹配

那么‘^$’就表示空行

4[]匹配括号中的字符之一

[abc]匹配单个字符abc

[123] 匹配单个字符123

[0-9]匹配0-9任意数字

[a-z]匹配小写字母a-z之一

[a-zA-Z]匹配任意英文字母之一

[0-9a-zA-Z]匹配任意英文字母或数字之一


[:digit:] 所有数字 [[:digit:]]等同于[0-9]

[:lower:] 所有小写字母 [[:lower:]]等同于[a-z]

[:upper:] 所有大写字母 [[:upper:]]等同于[A-Z]

[:alpha:] 所有字母 [[:alpha:]]等同于[a-zA-Z]

[:alnum:] 所有数字和字母 [[:alnum:]]等同于[0-9a-zA-Z]

[:sapce:] 空白字符

[:punct:] 所有标点符号

注意:上面标红色的单个和之一,不管[]里面多复杂,它的结果都是一个字符!

可以用^标记做[]内的前缀,表示除[]内的字符之外的字符。比如搜oo前没有g的字符串的行.应用'[^g]oo'作搜字符串^符号如果出现在[]的起始位置表示否定,但是在其他位置是普通字符[^ab^c]匹配不是ab^c的任意字符


5、*用于修饰前导字符,表示前导字符出现0次或任意多次,如:'a*grep'匹配所有0个或多个a后紧跟grep的行。.*”表示任意字符串


6、?用于修饰前导字符,表示前导字符出现01


7、+用于修饰前导字符,表示前导字符出现1或多次


8、{n,m}用于修饰前导字符,表示前导字符出现nmnm都是整数,且n<m

{n,m}还有其他几种形式:

{n}连续的n个前导字符

{n,}连续的至少n个前导字符


9、用于转义紧跟其后的单个特殊字符,使该特殊字符成为普通字符

如:^.[0-9][0-9]以一个句点和两个数字开始

注:以上“前导字符”表示紧贴于元字符前面的单个普通字符

例如:

a*匹配连续的任意(也包括0)个a

a?匹配01a

a+匹配1或多个a

a{3,5}匹配35个连续的a

.*匹配0或多个连续的..表示普通字符句点


10、|表示或如:a|b|c匹配abc。如:grep|sed匹配grepsed


11(),将部分内容合成一个单位组比如要搜刮gladgood可以如许'g(la|oo)d'

综合举例1:

1ChristianScottliveshereandwillputonaChristmasparty.

2Therearearound30to35peopleinvited.

3Theyare:

4Tom

5Dan

6RhondaSavage

7NickyandKimerly.

8Steve,Suzanne,GingerandLarry.

^[A-Z]..$

搜索行以AZ的一个字母开头,然后跟两个任意字母,然后跟一个换行符的行。将找到第5行。

^[A-Z][a-z]*3[0-5]

搜索以一个大写字母开头,后跟0个或多个小写字母,再跟数字3,再跟05之间的一个数字。

^*[A-Z][a-z][a-z]$

搜索以0个或多个空格开头,跟一个大写字母,两个小写字母和一个换车符。将找到第4行的TOM(整行匹配)和第5行。注意,*前面有一个空格。

^[A-Za-z]*[^,][A-Za-z]*$

将查找以0个或多个大写或小写字母开头,不跟逗号,然后跟0个或多个大写或小写字母,然后跟一个换车符。将找到第4和5行。

综合举例2:

#ls-l|grep'^...s'

上面的命令是用来查找suid文件的;

#ls-l|grep'^...s..s'

上面的命令是用来查找suidguid的。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读