基本正则表达式grep应用
前言 正则虐我千百遍,我待正则如初见。 ――煌朝 一、被大家视如洪水猛兽的正则表达式到底是什么呢, 1. 从概念上讲,正则表达式是对字符串操作的一种逻辑公式,就是要事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种逻辑过滤。 2. 简单来讲,就是用几个特定字符快速过滤出我们想要得到和看到的内容能够,跟像是添加查询条件。 二、我们为什么要学习正则表达式呢 1. 正则表达式的灵活性,逻辑性和功能性非常的强 2. 可以通过正则表达式,从字符串中获取我们想要的特定部分 3. 可以迅速的用极简单的方式表达到字符串的复杂控制。 三、正则表达式元字符[pattern] 1.^:锚定行首符合条件的内容 "^pattern" 2. $:锚定行为符合条件的内容 "pattern$" "^pattern$" 锚定pattern "^$" 表示锚定空白行 3. ?:匹配其前面字符0次或1次 4. {m,n}:匹配其前面字符至少m次,至多n次 5. {0,n}:匹配其前字符至多n次 6. {m,}:匹配器前面字符至少m次 7. {m}:精确匹配m次 8. &;:锚定词首,用法格式:&;pattern 等同于b: bpattern 匹配以pattern开头的单词 9. &;:锚定词尾,用法格式:pattern&; 等同于b:patternb 匹配以pattern结尾的单词 10. &;pattern&; 匹配单词pattern 11. ():分组,用法格式:(pattern) (ab){1,3} 匹配ab出现1-3次 12. (a.b).*1 匹配“a.b任意字符a.b” 1表示多个括号时引用第一个括号内的内容 13. .:匹配任意单个字符 14. *:匹配紧挨其前字符任意次,可以不出现 15. .*:匹配任意范围任意长度字符 16. []:匹配指定范围内的任意单个字符 17. [^]:匹配指定范围外的任意单个字符 18. [:space:]空白字符 19. [:digit:]任意数字 [[:digit:]]=[0-9] 20. [:lower:]小写字母 [[:lower:]]=[a-z] 21. [:upper:]大写字母 22. [:alpha:]所有字母 23. [:alnum:]所有数字 24. [:punct:]所有符号 四、grep 1. grep语法 grep [pattern][文件或目录...]
2. grep的选项 --color=auto #过滤出字体添加默认颜色 export GREP_COLOR='01;36' #改变字体默认颜色 -o 只显示匹配到的内容 -v 反向选取,只显示不符合模式的行 -i 不区分大小写 -A #显示匹配到的行时,顺带显示其后面的#行 -B #显示前面的#行 -C #显示前面和后面的#行 -E 使用扩展的正则表达式 -r 递归搜索,可以在目录及子目录中同时搜索 注:我理解grep跟正则表达式的关系 正则表达式是一种表达式,是一种逻辑;grep是支持正则表达是的一个命令,一种工具 五、光看元字符和grep选项是不是已经看蒙圈了呢,下面我们举些例子简单说明下: 1. 找出/proc/meminfo文件中以不区分大小写的s开头的行; [root@localhost ~]# grep --color=auto -i "^[s]" /proc/meminfo 解释:--color=auto 给过滤出的字体加默认颜色,-i表示不区分大小写,""里面表示过滤内容 2. 找出/etc/passwd中以nologin结尾的行 [root@localhost ~]# grep --color=auto "nologin$" /etc/passwd 解释:""中写需要过滤内容,$表示以前面的内容做为行尾,也可以加-o 只显示过滤内容 3. 找出/etc/rc.d/rc.sysinit中以#开头,且后面跟了空白字符,而后又跟了任意非空白字符的行 [root@localhost ~]# grep "^#[[:space:]][^[:space:]]*" /etc/rc.d/rc.sysinit 解释:^#以“#”开头,[[:space:]],表示一个或多个空白字符,[^[:space:]]非空白字符 4. 找出/etc/passwd中以一个字母开头,并且以开头字母结尾的行 [root@localhost ~]# grep --color=auto "(^[a-z]).*1$" /etc/passwd 解释:前面的(..)表示括号内的内容为一个选定词,后面1表示引用第一个()内的词 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |