加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则表达式的总结及实例

发布时间:2020-12-14 01:00:31 所属栏目:百科 来源:网络整理
导读:正则表达式的使用总结 Linux文本处理三剑客: grep: 文本过滤工具; sed:文本编辑器(行);stream editor awk:文本报告生成器;Linux上awk的实现为gawk grep: g lobally search a r egular e xpression and p rint 作用:文本搜索工具,根据用户指定的“模

正则表达式的使用总结


Linux文本处理三剑客:

grep: 文本过滤工具;

sed:文本编辑器(行);stream editor

awk:文本报告生成器;Linux上awk的实现为gawk


grep:globally search aregularexpressionandprint


作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;

模式:由正则表达式的元字符及文本字符所编写的过滤条件;

元字符:字符不表示其字面意义,而用于表示通配或控制功能;


分两类:

基本正则表达式:BRE

扩展正则表达式:ERE

正则表达式引擎;


grep [OPTIONS] PATTERN [FILE...]:

选项:

--color=auto:对匹配到的串做高亮显示;

-v:显示模式匹配不到行;

-i: 忽略字符大小写;

-o: 仅显示能够被模式匹配到的串本行;

-q: 静默模式;

-E:使用扩展的正则表达式;


基本正则表达式的元字符:

字符匹配:

.: 匹配任意单个字符;

[]:匹配指定范围内的任意单个字符;

[^]:不匹配指定范围内的任意单个字符;


[:alnum:]文字数字字符

[:alpha:]文字字符

[:digit:]数字字符

[:graph:]非空字符(非空格、控制字符)

[:lower:]小写字符

[:cntrl:]控制字符

[:print:]非空字符(包括空格)

[:punct:]标点符号

[:space:]所有空白字符(新行,空格,制表符)

[:upper:]大写字符

[:xdigit:]十六进制数字(0-9,a-f,A-F)


次数匹配:用于要指定前面字符匹配的次数;

*: 任意次


?:0或1次;

+:1或多次;

{m}:精确限制为m次;

{m,n}: 至少m次,至多n次,[m,n]

{0,n}:至多n次;

.*: 匹配任意长度的任意字符;


位置锚定:

^: 行首锚定;用于模式的最左侧;

$: 行尾锚定;用于模式的最右侧;

&;,b: 词首锚定;用于表示单词的模式的左侧;

&;,b:词尾锚定;用于表示单词的模式的右侧;

^$: 空白行;


分组:()

分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是1,2,...


后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;


1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;

2:

...



扩展的正则表达式:

grep家庭有三个命令:

grep:基本正则表达式

-E: 扩展正则表达式(等同于egrep命令)

-F:不支持正则表达式(等同于fgrep命令)

egrep:扩展正则表达式

fgrep:不支持正则表达式


扩展正则表达式的元字符:

字符匹配:

.: 匹配任意单个字符;

[]:匹配指定范围内的任意单个字符;

[^]:不匹配指定范围内的任意单个字符;


次数匹配:

*:任意次

?: 0次或1次;

+: 1次以上;

{m}: 精确匹配m次;

{m,n}: 至少m次,至多n次;


锚定:

^: 锚定行首

$: 锚定行尾


分组:()

后向引用:1,sans-serif;white-space:pre;">或者:

a|b

C|cat: 不表示Cat或cat,而表示C或cat;

要写成(C|c)at

扩展正则表达式主要是简化掉了正则表达式中的转义字符,除了锚定词首词尾;另外扩展正则表达式加上了“|”的功能

一、作业(练习)内容:

1、总结本此课程中所涉及命令的使用方法及相关示例展示;

2、总结基本正则表达式及扩展正则表达式

3、显示/etc/passwd文件中以bash结尾的行

grep "bash&;" /etc/passwd

4、显示/etc/passwd文件中的两位数或三位数

grep --color=auto "&;[0-9]{2,3}&;" /etc/passwd

5、显示`netstat -tan`命令结果中以‘LISTEN’后跟0个、1个或者多个空白字符结尾的行

netstat -tan | grep --color=auto "LISTEN[[:space:]]*$"

6、添加用户bash、testbash、basher以及nologin用户(nologin用户的shell为/sbin/nologin);而后找出/etc/passwd文件中用户名与其shell名相同的行

grep "^([[:alnum:]]{1,})&;.*&;1$" /etc/passwd

7、显示当前系统上root、centos或者user1用户的默认shell和UID (请事先创建这些用户,若不存在)

grep -E "^(centos|user1|root)&;" /etc/passwd | cut -d: -f3,6

8、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行

grep "&;[[:alpha:]]*[_]*[[:alpha:]]*&;()" /etc/rc.d/init.d/functions

9、使用echo输出一个路径,而后egrep找出其路径基名;进一步的使用egrep取出其目录名

echo /etc/rc.d/init.d/functions | egrep -o "[^/]*$"

echo /etc/rc.d/init.d/functions | egrep -o "[^/]*/[^/]*$" | egrep -o "^[^/]*"

10、找出ifconfig命令执行结果中1-255之间的数字

ifconfig | egrep --color=auto "&;([1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])&;"

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读