加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

grep和正则表达式的应用

发布时间:2020-12-14 01:00:40 所属栏目:百科 来源:网络整理
导读:Linux 文本处理三剑客 grep: 文本过滤工具 sed :文本编辑器(行),stream editor awk :文本报告生成器,Linux上awk的实现为gawk grep : Global search REgular expression and Print out theline . 作用 :文本搜索工具,根据用户指定的“模式(pattern)”逐行


Linux文本处理三剑客

  • grep:文本过滤工具

  • sed:文本编辑器(行),stream editor

  • awk:文本报告生成器,Linux上awk的实现为gawk

grep: Global search REgular expression and Print out theline.

  • 作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行

  • 模式:由正则表达式的元字符及文本字符所编写的过滤条件

    语法:grep [OPTIONS] PATTERN [FILE...]:

选项

--color=auto:对匹配到的串做高亮显示;

-v:显示模式匹配不到的行;

-i:忽略字符大小写;

-o:仅显示能够被模式匹配到的串本行,而且每匹配到的一个就分一行,可以方便统计次数;

-q: 静默模式;

-E:使用扩展的正则表达式;


正则表达式分2类:

  • 基本正则表达式:BRE

  • 扩展正则表达式:ERE

基本正则表达式的元字符:(字符不表示其字面意义,而用于表示通配或控制功能)

  • 字符匹配

.:匹配任意单个字符;

[]:匹配指定范围内的任意单个字符;

[^]:匹配指定范围外的任意单个字符;

[:lower:] 小写字符

[:upper:] 大写字符

[:space:] 空格

[:alnum:] 大小写字符及数字

[:alpha:] 大小写字符,A-Z,a-z

[:punct:] 标点符号


  • 次数匹配:用于要指定其次数的字符的后面,只能用于前一个字符*:任意次

grep.txt文件内容

abxy

xay

xxxxxxxy

wKiom1XhHy_QjaKBAAA3eXD90ws825.jpg

?:0或1次

wKioL1XhIWbAM5ckAABBoPHQZp0137.jpg

+:1或多次

{m}:精确限制为m次

{m,n}:至少m次,至多n次,[m,n]

{0,n}:至多n次

:至少m次

wKioL1XhIYGypVNyAAA8_mI3OXE559.jpg

.*:匹配任意长度的任意字符;

wKioL1XhIZWyBzPBAABIaVFzbdY445.jpg

  • 位置锚定:

^:行首锚定;用于模式的最左侧

$:行尾锚定;用于模式的最右侧

&;,b: 词首锚定;用于表示单词的模式的左侧

&;,b:词尾锚定;用于表示单词的模式的右侧

^$:空白行

  • 分组:()

分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是1,2,...

1:从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;

2...原理同上,第二个

后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;


扩展的正则表达式元字符及其意义:

? #匹配0个或1个在其之前的那个普通字符

+ #匹配1个或多个在其之前的那个普通字符

() #表示一个字符集合或用在expr中

| #表示“或”,匹配一组可选的字符

练习

3、显示/etc/passwd文件中以bash结尾的行
grep "bbash$" /etc/passwd


4、显示/etc/passwd文件中的两位数或三位数
grep "b[0-9]{2,3}b" /etc/passwd
grep -E "b[0-9]{2,3}b" /etc/passwd


5、显示`netstat -tan`命令结果中以‘LISTEN’后跟0个、1个或者多个空白字符结尾的行
netstat -tan | grep "LISTEN[[:space:]]*"


6、添加用户bash、testbash、basher以及nologin用户(nologin用户的shell为/sbin/nologin); 而后找出/etc/passwd文件中用户名与其shell名相同的行
grep "^([[:alnum:]]+&;).*1$" /etc/passwd


7、显示当前系统上root、centos或者user1用户的默认shell和UID (请事先创建这些用户,若不存在)
grep -E "centos|user1|root" /etc/passwd | awk -F: '{print $3 "t" $7}'

8、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行
grep "&;[0-9a-zA-Z_]+&;()" /etc/rc.d/init.d/functions


9、使用echo输出一个路径,而后egrep找出其路径基名;进一步的使用egrep取出其目录名
取路径基名(方法二这种去尾部特定字符的方法很好用哦):

方法一 echo "/etc/aa/bb/cc/aa5555t.fs/" |grep -Eo "[^/]+/?$" | grep -o ".*[^/]"
方法二 echo "/etc/aa/bb/cc/aa5555t.fs/" |grep -Eo ".*[^/]" |grep -Eo "[^/]+$"
取目录名(其中有利用贪婪模式原理):

echo "/etc/aa/bb/cc/aa5555t.fs" |grep -Eo "/.*[^/]" |grep -Eo "/.*/" | grep -Eo ".*[^/]" |grep -Eo "[^/]+$"


10、找出ifconfig命令执行结果中1-255之间的数字 ifconfig |grep -E 'b(([1-9])|([1-9][0-9])|(1[0-9][0-9])|2[0-5][0-5])b'

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读