加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

grep和正则表达式

发布时间:2020-12-14 01:23:58 所属栏目:百科 来源:网络整理
导读:grep命令是一个模式识别命令。它用来查看在一个文件或其他命令的输出中是否有某个词或一组词。如: grep alapati test.txt . 本例中,grep命令检查"alapati"是否出现在文件test.txt中。答案为是如果需要搜索大文件,查看是否包含特定信息,应当使用grep使用。

grep命令是一个模式识别命令。它用来查看在一个文件或其他命令的输出中是否有某个词或一组词。如:

grep alapati test.txt .本例中,grep命令检查"alapati"是否出现在文件test.txt中。答案为是如果需要搜索大文件,查看是否包含特定信息,应当使用grep使用。如果查找的词或词组不在文件中,将简单地返回UNIX提示符。


1、grep的命令格式

grep[OPTIONS]PATTERN[FILE...]
grep[OPTIONS][-ePATTERN|-fFILE][FILE...]

2、grep退出状态:

0: 表示成功;

1: 表示在所提供的文件无法找到匹配的pattern;

2: 表示参数中提供的文件不存在。


见如下示例:

查找成功返回0

root@oracle.dba.No1[15:47:11]~>>grep'root'/etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
root@oracle.dba.No1[15:48:06]~>>echo$?
0

在passwd文件中无法打到root1 当没有找到pattern是返回1 这里root1用户并不存在

root@oracle.dba.No1[15:48:14]~>>grep'root1'/etc/passwd
root@oracle.dba.No1[15:48:45]~>>echo$?
1


当所给定的文件不存在时返回2

root@oracle.dba.No1[15:47:06]~>>grep'root'/etc/passws
grep:/etc/passws:没有那个文件或目录
root@oracle.dba.No1[15:47:10]~>>echo$?
2

3. grep中应用正则表达式的实例:

root@oracle.dba.No1[11:18:26]~>>catdatafile.txt
northwestNWCharlesMain3.0.98334
westernWESharonGray5.3.97523
southwestSWLewisDalsass2.7.8218
southernSOSuanChin5.1.95415
southeastSEPatriciaHemenway4.0.7417
easternEATBSavage4.4.84520
northeastNEAMMainJr.5.1.94313
northNOMargotWeber4.5.8959
centralCTAnnStephens5.7.94513

1、打印出datafile中所有包含NW的行

>>grepNWdatafile.txt
northwestNWCharlesMain3.0.98334

2、打印出datafile中所有以n开头的行

>>grep'^n'datafile.txt
northwestNWCharlesMain3.0.98334
northeastNEAMMainJr.5.1.94313
northNOMargotWeber4.5.8959

3、打印出以/etc/passwd文件中以h结尾的行

>>grep'h$'/etc/passwd
root:x:0:0:root:/root:/bin/bash
oracle:x:500:500::/home/oracle:/bin/bash

4、打印出第一个字符是5,后面跟着一个.字符,在后面是任意字符的行

>>grep'5..'datafile.txt
westernWESharonGray5.3.97523
southernSOSuanChin5.1.95415
northeastNEAMMainJr.5.1.94313
centralCTAnnStephens5.7.94513

5、打印出所有包含.5的行

>>grep'.5'datafile.txt
northNOMargotWeber4.5.8959

6、打印出所有以w或e开头的行

>>grep'^[we]'datafile.txt
westernWESharonGray5.3.97523
easternEATBSavage4.4.84520


7、打印出所有不是以0-9开头的行。

>>grep'[^0-9]'datafile.txt
northwestNWCharlesMain3.0.98334
westernWESharonGray5.3.97523
southwestSWLewisDalsass2.7.8218
southernSOSuanChin5.1.95415
southeastSEPatriciaHemenway4.0.7417
easternEATBSavage4.4.84520
northeastNEAMMainJr.5.1.94313
northNOMargotWeber4.5.8959
centralCTAnnStephens5.7.94513

8、打印出所有包含前两个字符是大写字符,后面紧跟一个空格及一个大写字母的行。

>>grep'[A-Z][A-Z][A-Z]'datafile.txt
easternEATBSavage4.4.84520
northeastNEAMMainJr.5.1.94313

注:在执行以上命令时,如果不能得到预期的结果,即grep忽略了大小写,导致这一问题的原因很可能是当前环境的本地化的设置问题。对于以上命令,如果我将当前语言设置为en_US的时候,它会打印出所有的行,当我将其修改为中文环境时,就能得到我现在的输出了。 /> export LANG=zh_CN #设置当前的语言环境为中文。
/> export LANG=en_US #设置当前的语言环境为美国。
/> export LANG=en_Br #设置当前的语言环境为英国。


9、打印所有包含每个字符串至少有9个连续小写字符的字符串的行

>>grep'[a-z]{9}'datafile.txt
northwestNWCharlesMain3.0.98334
southwestSWLewisDalsass2.7.8218
southeastSEPatriciaHemenway4.0.7417
northeastNEAMMainJr.5.1.94313

10、第一个字符是3,紧跟着一个句点,然后是任意一个数字,然后是任意个任意字符,然后又是一个3,然后是制表符,然后又是一个3,需要说明的是,下面正则中的1表示(3)。

>>grep'(3).[0-9].*1*1'datafile.txt
northwestNWCharlesMain3.0.98334

11、打印所有以north单词开头的行

>>grep'&;north'datafile.txt
northwestNWCharlesMain3.0.98334
northeastNEAMMainJr.5.1.94313
northNOMargotWeber4.5.8959

12、打印所有包含单词north的行。

>>grep'&;north&;'datafile.txt
northNOMargotWeber4.5.8959

13、第一个字符是n,后面是任意字母或者数字

>>grep'^nw*'datafile.txt
northwestNWCharlesMain3.0.98334
northeastNEAMMainJr.5.1.94313
northNOMargotWeber4.5.8959

4 . 扩展grep(grep -E 或者 egrep):

使用扩展grep的主要好处是增加了额外的正则表达式元字符集。下面我们还是继续使用实例来演示扩展grep。

1、打印所有包含NW或EA的行。如果不是使用egrep,而是grep,将不会有结果查出。

>>egrep'NW|EA'datafile.txt
northwestNWCharlesMain3.0.98334
easternEATBSavage4.4.84520

2、对于标准grep,如果在扩展元字符前面加,grep会自动启用扩展选项-E

>>grep'NW|EA'datafile.txt
northwestNWCharlesMain3.0.98334
easternEATBSavage4.4.84520

3、#这3条命令将会打印出相同的结果,即所有包含一个或多个3的行。

>>egrep'3+'datafile.txt
>>grep-E'3+'datafile.txt
>>grep'3+'datafile.txt
northwestNWCharlesMain3.0.98334
westernWESharonGray5.3.97523
northeastNEAMMainJr.5.1.94313
centralCTAnnStephens5.7.94513

4、首先含有2字符,其后紧跟着0个或1个点,后面再是0和9之间的数字

>>egrep'2.?[0-9]'datafile.txt
>>grep-E'2.?[0-9]'datafile.txt
>>grep'2.?[0-9]'datafile.txt
westernWESharonGray5.3.97523
southwestSWLewisDalsass2.7.8218
easternEATBSavage4.4.84520

5、3个命令返回相同结果,即打印一个或者多个连续的no的行。

>>>egrep'(no)+'datafile.txt
>>>grep-E'(no)+'datafile.txt
>>>grep'(no)+'datafile.txt
northwestNWCharlesMain3.0.98334
northeastNEAMMainJr.5.1.94313
northNOMargotWeber4.5.8959


6、首先是一个或者多个字母,紧跟着一个或者多个非字母数字,最后一个是ABC中的一个。

>>>grep-E'w+W+[ABC]'datafile.txt
northwestNWCharlesMain3.0.98334
southernSOSuanChin5.1.95415
northeastNEAMMainJr.5.1.94313
centralCTAnnStephens5.7.94513


7、3个命令返回相同结果,即以S或s开头,紧跟着h或者u的行

>>>egrep'[Ss](h|u)'datafile.txt
>>>grep-E'[Ss](h|u)'datafile.txt
>>>grep'[Ss](h|u)'datafile.txt
westernWESharonGray5.3.97523
southernSOSuanChin5.1.95415

8、west开头,其中es为1的值,后面紧跟着任意数量的任意字符,最后还有一个es出现在该行

>>>egrep'w(es)t.*1'datafile.txt
northwestNWCharlesMain3.0.98334

5. grep选项:

这里先列出grep常用的命令行选项:

-c 只显示有多少行匹配,而不具体显示匹配的行。

-h 不显示文件名。

-i 在字符串比较的时候忽略大小写。

-l 只显示包含匹配模板的行的文件名清单。

-L 只显示不包含匹配模板的行的文件名清单。

-n 在每一行前面打印改行在文件中的行数。

-v 反向检索,只显示不匹配的行。

-w 只显示完整单词的匹配。

-x 只显示完整行的匹配。

-r/-R 如果文件参数是目录,该选项将递归搜索该目录下的所有子目录和文件


1、-n选项在每一个匹配行的前面打印行号

[root@Oracle~]>>>grep-n'^south'datafile.txt
3:southwestSWLewisDalsass2.7.8218
4:southernSOSuanChin5.1.95415
5:southeastSEPatriciaHemenway4.0.7417

2、-i选项关闭了大小写敏感

>>>grep -i 'pat' datafile.txt

southeast SE Patricia Hemenway 4.0 .7 4 17

3、-v 反选 打印所有不包含Suan Chin的行

>>>grep-v'SuanChin'datafile.txt
northwestNWCharlesMain3.0.98334
westernWESharonGray5.3.97523
southwestSWLewisDalsass2.7.8218
southeastSEPatriciaHemenway4.0.7417
easternEATBSavage4.4.84520
northeastNEAMMainJr.5.1.94313
northNOMargotWeber4.5.8959
centralCTAnnStephens5.7.94513

>>>grep'SuanChin'datafile.txt
southernSOSuanChin5.1.95415

4、-l使得grep只打印匹配的文件名,而不打印匹配的行。

>>>grep-l'ss'datafile.txt
datafile.txt

5、 -c使得grep只打印有多少匹配模板的行

>>>grep-c'west'datafile.txt
3

6、-w只打印整个单词匹配的行

>>>grep-w'north'datafile.txt
northNOMargotWeber4.5.8959

7、 -C打印匹配行及其上下各两行

>>>grep-C2--color=autoPatriciadatafile.txt
southwestSWLewisDalsass2.7.8218
southernSOSuanChin5.1.95415
southeastSEPatriciaHemenway4.0.7417
easternEATBSavage4.4.84520
northeastNEAMMainJr.5.1.94313

8、 -B打印匹配行及其前两行

>>>grep-B2--color=autoPatriciadatafile.txt
southwestSWLewisDalsass2.7.8218
southernSOSuanChin5.1.95415
southeastSEPatriciaHemenway4.0.7417

9、 -A 打印匹配行及其后两行

>>>grep-A2--color=autoPatriciadatafile.txt
southeastSEPatriciaHemenway4.0.7417
easternEATBSavage4.4.84520
northeastNEAMMainJr.5.1.94313

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读