第七章、grep及正则表达式
第七章、grep及正则表达式 04_04_grep及正则表达式 grep家族: grep,egrep,fgrep
grep:根据模式搜索文本,并将符合模式的文本行显示出来。 Pattern:文本字符和正则表达式的元字符组合而成匹配条件 grep [options] PATTERN [FILE...] -i:忽略大小写 --color:匹配到的字符带颜色 -v::显示没有被模式匹配到的行 -o:只显示被模式匹配到的字符串 通配符: 1. *:任意长度的任意字符 2. ?:任意单个字符 3. []: 4. [^]:正则表达式:REGular EXPression,REGEXP 元字符: 1. .:匹配任意单个字符 2. []:匹配指定范围内的任意单个字符 3. [^]:匹配指定范围外的任意单个字符 字符集合:[:digit:],[:lower:],[:upper:],[:punct:],[:space:],[:alpha:],[:alnum:] 匹配次数(贪婪模式): 匹配其前面的字符任意次 e.g: 有:a,b,ab,aab,acb,adb,amnb,下面pattern会匹配那些字符串? a*b: b,aab a?b: b,ab a.*b: ab,amnb .*:任意长度的任意字符 2. ?:匹配其前面的字符1次或0次 3. {m,n}:匹配其前面的字符至少m次,至多n次 {1,} - 至少1次 {0,3} - 至多3次 位置锚定: 1. ^:锚定行首,此字符后面的任意内容必须出现在行首 2. $:锚定行尾,此字符前面的任意内容必须出现在行尾 ^$:空白行 3. &;或b:锚定词首,其后面的任意字符必须作为单词首部出现 4. &;或b:锚定词尾,其前面的任意字符必须作为单词的尾部出现 分组: () (ab)*:ab作为整体,出现n次 后向引用 1:引用第一个左括号以及与之对应的右括号所包括的所有内容 2: 3: e.g: He love his lover. She like her liker. He like his lover. grep '(l..e).*1' test.txt 匹配到1,2行 练习: 1、显示/proc/meminfo文件中以不区分大小的s开头的行; grep -i '^s' /proc/meminfo grep '^[sS]' /proc/meminfo 2、显示/etc/passwd中以nologin结尾的行; grep 'nologin$' /etc/passwd 取出默认shell为/sbin/nologin的用户列表 grep "nologin$' /etc/passwd | cut -d: -f1 取出默认shell为bash,且其用户ID号最小的用户的用户名 grep 'bash$' /etc/passwd | sort -n -t: -k3 | head -1 | cut -d: -f1 3、显示/etc/inittab中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行; grep "^#[[:space:]]{1,}[^[:space:]]" /etc/inittab 4、显示/etc/inittab中包含了:一个数字:(即两个冒号中间一个数字)的行; grep ':[0-9]:' /etc/inittab 5、显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行; grep '^[[:space:]]{1,}' /boot/grub/grub.conf 6、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行; grep '^([0-9]).*1$' /etc/inittab 1、找出某文件中的,1位数,或2位数; grep '[0-9]{1,2}' /proc/cpuinfo grep --color '&;[0-9]{1,2}&;' /proc/cpuinfo 2、找出ifconfig命令结果中的1-255之间的整数; 需要使用扩展正则表达式 ifconfig | egrep --color '&;([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-9][0-9])&;' 3、查找当前系统上名字为student(必须出现在行首)的用户的帐号的相关信息,文件为/etc/passwd grep '^student&;' /etc/passwd | cut -d: -f3 id -u student student1 student2 练习: 分析/etc/inittab文件中如下文本中前两行的特征(每一行中出现在数字必须相同),请写出可以精确找到类似两行的模式: l1:1:wait:/etc/rc.d/rc 1 l3:3:wait:/etc/rc.d/rc 3 grep '^l([0-9]):1.*1$' /etc/inittab 05_01_egrep及扩展正则表达式 复习: REGEXP:REGular EXPression Pattern:模式 正则表达式: Basic REGEXP:基本 Extended REGEXP:扩展 基本正则表达式: .: []: [^]: 次数匹配: *: ?: 0或1次 {m,n}:至少m次,至多n次; .*: 锚定: ^: $: &;,b: &;,'Microsoft YaHei';">1,2,3,... grep:使用基本正则表达式定义的模式来过滤文本的命令; -i -v -o --color -E:使用扩展正则表达式 -A n: 显示匹配到的行和其后的n行 -B n: 前的n行 -C n: 前后各n行 扩展正则表达式:省略很多反斜线 字符匹配: . [] [^] 次数匹配: ?: +:匹配其前面的字符至少1次,{1,} {m,n}:
位置锚定: ^ $ &; &; 分组: ():分组 或者 |: or C|cat:C或cat, 不是Cat或cat,这个用 '(C|c)at' grep -E = egrep 4、显示所有以数字结尾且文件名中不包含空白的文件; bash特性详解时的未解问题 ls .*[^[[:space:]].*[0-9]$ 找出/boot/grub/grub.conf文件中1-255之间的数字; &;([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])&; 找出ifconfig中的IP地址 ifconfig | egrep '&;([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])&;.&;([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])&;.&;([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])&;.&;([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])&;' ifconfig | egrep --color '(&;([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])&;.){3}&;([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])&;' 找出ifconfig中的ABC 3类IP地址 IPv4: 5类:A B C D E A:1-127 B:128-191 C:192-223 &;([1-9]|[1-9][0-9]|1[0-9]{2}|2[01][0-9]|22[0-3])&;(.&;([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])&;){2}.&;([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])&;
马哥51cto博客: http://mageedu.blog.51cto.com/ fgrep:快速grep,不支持正则表达式 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |