加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

grep、egrep以及正则表达式的使用

发布时间:2020-12-14 04:22:57 所属栏目:百科 来源:网络整理
导读:正则表达式是 linux 学习里面很重要的一部分内容,也算是一个难点,元字符多,组合方法也各种各样,每个人学习理解方法不一样,其中遇到的问题也各不相同, 学习正则表达式首先要会的是 grep 以及 egrep 命令的使用。 grep 是 GlobalsearchRegularexpression

正则表达式是linux学习里面很重要的一部分内容,也算是一个难点,元字符多,组合方法也各种各样,每个人学习理解方法不一样,其中遇到的问题也各不相同,

学习正则表达式首先要会的是grep以及egrep命令的使用。

grepGlobalsearchRegularexpressionanPrintouttheline的缩写,是一种文本搜索的工具,可以根据用户指定的模式(pattern对目标文本进行搜索过滤,显示出被模式匹配到的行。这里要说的一点是,grep匹配到的是符合模式的一整行,例如一行中有2位数同时有3位数,模式中匹配的是2位数,这一行是会被匹配到的,

1

grep[OPTIONS]PATTERN[FILE...]

option

作用

-i

匹配时忽略字符大小写

-o

仅显示匹配到的内容

-v

取反,显示没有匹配到的行

--color

高亮显示匹配到的内容

-A#

显示出匹配的行之后的下文#行

-B#

显示出匹配的行之前的上文#行

-C#

显示出匹配的行前后的#行

-E

使用扩展的正则表达式,后面会有介绍

这只是一些常用的选项,具体使用过程中遇到,可以使用man命令查看

这仅仅是grep的简单用法,要想充分利用grep需要配合正则表达式。

正则表达式分为两类:

基本正则表达式

扩展正则表达式

基本正则表达式由能够实现不同功能的元字符组成,下面按照元字符不同的作用分别说明,为了方便看出匹配到的内容,我们先给grep一个别名,就是用上面的--color选项,能够高亮显示出匹配到的内容,匹配到的内容会以紫色显示。

字符匹配:用来对文本中的字符进行匹配的元字符

.

匹配任意单个字符

[]

匹配集合内的任意单个字符

[^]

匹配集合外的任意单个字符

其中[]有几个特殊的表示方法

[0-9],[[:digit:]]

集合内的任意单个数字

[a-z],[[:lower:]]

集合内的任意单个小写字母

[A-Z],[[:upper:]]

集合内的任意单个大写字母

[a-zA-Z],[[:alpha:]]

集合内的任意单个字母

[[:space:]]

单个空白字符

[a-zA-Z0-9],[[:alnum:]]]

集合内的任意单个字母数字

[[:punct:]]

集合内的任意单个特殊字符

.:匹配任意单个字符

wKioL1df4kyiSMEfAAA35W402Q4569.png

搜索/etc/passwd中含有rt中间有一个任意字符的行

[]:匹配指定集合中的任意单个字符;

[[:digit:]],[0-9]:匹配符合搜索范围的数字;

wKiom1df4VThLqDSAADSiM88HSg134.png

[[:lower:]],[a-z]:匹配符合搜索范围的小写字母;

wKioL1df4nmxGrQDAACZeIb4314329.png

[[:upper:]],[A-Z]:匹配符合搜索范围的大写字母;

wKioL1df4pCRfJRmAACThAoET6M421.png

[[:alpha:]],[a-zA-Z]:匹配符合搜索范围的大小写字母;

wKiom1df4bHRk2ALAACj3IupYj4533.png

[[:alnum:]],[0-9a-zA-Z]:匹配符合搜索范围的数字字母,两个都可以实现这个功能;

wKioL1df4wrhSrhfAAC1CLv4Fi4977.png

[[:space:]]:匹配单个空格,这一行因为有个空白字符,所以被匹配出来了,因为是空白字符,就不能高亮显示了;

wKiom1df4hehirpxAABVIoQcBY8763.png

[[:punct:]]:即标点符号;

wKioL1df4znyJI5-AAB9Ta7hVEU290.png

[^]:匹配指定集合外的任意单个字符,匹配任意非数字字母的字符,/字符被匹配到了;

wKioL1df41DwGLPVAABXwsuOYak425.png

次数匹配,用于对前面紧邻的单个字符所能够出现的次数做出限定;

*

匹配其前面的字符任一次,即表示0次、1次或多次

?

匹配其前面的字符0次或者一次

+

匹配其前面的字符出现至少1次

{m}

匹配其前面的字符m次,这是准确到多少次的

{m,n}

匹配其前面的字符至少m次,至多n次

*:匹配其前面的字符任一次,即表示0次、1次或多次;

wKiom1df4l7C8XVqAABqekw6Njw209.png

*前面的字符o出现0次或者多次,而且其后紧跟字符r,所以r,rr,or,oor等都可以匹配到,ont就不能匹配到,因为ot之间不是相邻的。

?:匹配其前面的字符0次或者一次,这里要注意只有色的部分匹配到了,虽然前面有很多个a,但是因为an匹配到了,所以整行显示出来了。

wKioL1df45XQG5yfAABXYR_v_jY613.png

+:匹配其前面的字符出现至少1次;

wKiom1df4o2R2eceAAAxT9a6xRo909.png

{m}:匹配其前面的字符m次,这是准确到多少次;

wKiom1df4qHyzI_9AAA2pb6iaPU559.png

{m,n}:匹配其前面的字符至少m次,至多n次;

wKioL1df48LSG912AAAR1ZujoKU394.png

那么“.*”代表什么呢?很明显,匹配任意单个字符,所有的字符都被匹配到了;

wKiom1df4sCTJyphAAARvYp2CR0646.png

位置锚定:

^

行首锚定,出现在模式的最左侧

$

行尾锚定,出现在模式的最右侧

&;或者b

词首锚定,出现在要查找的单词模式的最左侧

&;或者b

词尾锚定,出现在要查找的单词模式的最右侧

^:行首锚定,写在模式的最左侧,^lo

即为匹配以l开头的后面跟了o的字符;

wKioL1df4-PwbsZEAAARC56RzNQ458.png

$:行尾锚定,写在模式的最右侧,ve$’即为以e结尾前面有v的字符;

wKiom1df4v-DwUJbAAAR5TUp1H4944.png

^$:空白行,这个很容易理解,行首遇到了行尾,那就是什么都没有了,即空白行;

wKioL1df5CrxhcbtAAAIF1RmoqI260.png

&;:词首锚定,b,出现在要查找的单词模式的左侧;

“&;the只有作为一个单词的词首的the才能被匹配上;

wKiom1df4yWyodP0AABN-2s5M08391.png

&;:词尾锚定,b,出现在要查找的单词模式的右侧;

ve&;”只有作为一个单词的词尾的ve才能匹配上;

wKiom1df4z-TAkz2AABblS-ramE530.png

&;pattern&;:匹配单词;

如:&;love&;,即匹配单词love,因为以l为词首以e为词尾中间是ov的只能是单词love

wKioL1df5L-SdOGoAAAgI4AsCpo241.png

分组:(需要分组的内容),分组是为了后面可以引用前面模式匹配到的内容,这里就要介绍下后向引用的概念了。

后向引用:模式中,如果使用实现了分组,在某行文本的检查中,如果()中的模式匹配到了

某内容,此内容后面的模式中可以被引用;

1,2,3

模式自左而右,引用第#个左括号以及与其匹配右括号之间的模式匹配到的内容;

如:“(j.n).*1”()中匹配到的内容会被引用到后面的1的位置,前面匹配到了什么内容,后面也必须是这个内容;

johnaaabcjohn,前面匹配到了john那后面也必须是john

wKioL1df5MuwP60JAAAo5Lx7j0A265.png

egrep及扩展的正则表达式

扩展正则表达式有两种使用方法

1

#grep-E'pattern'file...

1

#egrep'pattern'file...

扩展正则表达式的元字符:

字符匹配:

.

匹配单个字符

[]

匹配集合中的单个字符

[^]

匹配集合之外的单个字符

扩展正则表达式的字符匹配是和正则表达式的一样的

次数匹配:

*

匹配其前面的字符任一次

?

匹配其前面字符0次或1次

+

匹配其前面的字符至少1次

{m}

匹配其前面的字符m次

{m,n}

匹配其前面的字符m-n次

{m,}

匹配其前面的字符至少m次

{0,n}

匹配其前面的字符0-n次

从这我们可以发现,扩展正则表达式只是将正则表达式的号去掉了而已,其他的用法都是一样的,在模式中起到了一个转译的作用,而在扩展正则表达式中则默认转译了,不需要在加转译符号

位置锚定:

^

行首锚定

$

行尾锚定

&;或者b

词首锚定

&;或者b

词尾锚定

扩展正则表达式的位置锚定也是和正则表达式一样的,这里的不能省略。

分组:

():同样不需要转译符,也和正则表达式一样支持后向引用1,23,…

或者:

a|b:a或者b

ab|cdab或者cd

这是扩展正则表达式所独有的元字符,表示或者,需要注意的是“|”符号左右两边是一个整体。

最后介绍一下fgrep

fgrep[option]'string'file...

fgrep不支持正则表达式,只支持字符串的搜索,即string为什么匹配到的就是什么,是一种快速搜索文本的命令。

从上面可以看出扩展的正则表达式要比正则表达式简洁,而且还能实现更多的功能,所以我们要多多使用扩展正则表达式

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读