grep ,正则表达式
grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包 括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。 grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。 grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。 正则表达式分类 基本正则表达式 (Basic Regular Expression ) BREs 扩展正则表达式 (Extend Regular Expression ) EREs perl的正则表达式 (Perl Regular Expression ) PREs 格式 grep [options] pattern [file…] 选项和参数 (比较常用的选项,了解更多使用man grep 查看) --color=auto -n 加上相对应的行号 -v --invert-match 反向选取 -o --only-matching 只显示被模式匹配到的字串 ,而不是整个行 -i --ignore-case 忽略大小写 -l --files-with-matches 只列出匹配的文件名 -L --files-without-matches 只列出不匹配的文件名 -w --word-regexp 匹配完整字符串(单词) -A Number 显示匹配到的行 并显示其后面的Number行 -B Number 显示匹配到的行 并显示其前面的Number行 -C Number …… 显示前后面的Number行 -E --extended-regexp 支持扩展正则表达式 元字符: ^:锚定行首的符合条件的内容,用法格式“^grep”; $:锚定行尾的符合条件的内容,用法格式“grep$”; .:匹配任意单个字符; *:匹配紧挨在其前面的字符任意次; .*:匹配任意长度的任意字符; []:匹配包含内的任一字单个字符; [^]:匹配包含外的任一字单个字符; :将下一字符标记为特殊字符、文本、反向引用或八进制转义符; ?:匹配紧挨在其前面的字符0次或1次; &;:锚定词首 &;:锚定词尾 x{m}:匹配其前面的字符“x”m次(精确匹配); x{m,}:匹配其前面的字符“x”至少m次; x{m,n}:匹配其前面的字符“x”至少m次,至多n次; ():分组; 字符集合: [:lower:]:代表小写字母,即 a-z [:upper:]:代表大写字母,即 A-Z [:digit:]:代表数字,即 0-9 [:alpha:]:代表任何英文大小写字母,即 a-z A-Z [:alnum:]:代表英文大小字符及数字,即 0-9 a-z A-Z [:space:]:代表空格键与Tab按键 [:punct:]:代表标点符号,即 “ , ;? ! : # $ grep及正则表达式实例 1. 在/etc/paswd文件查找匹配root的串 并以高亮显示其匹配的字符串 2. 在/etc/passwd文件中查找以root开头的行 并将其显示 通过行其锚定进行匹配 此次匹配的内容仅是以root开头的行 在其他位置出现的不匹配 3. 在/etc/passwd文件中查找以/bin/bash结尾的行 并将其显示 4. 在/etc/passwd文件中查找bin的字符串和锚定后bin字符串的比较 锚定后 通过锚定/< />进行字符串完全匹配 如果不适用锚定符 将会有/sbin类似的字符串一起出来 5.在/etc/passwd文件中查找匹配俩个bin之间包含的任意字符的行
该查找以bin为分组进行匹配 命令中1 表示引用第一个分组的内容 如果字符串中有多个分组
可以用23进行引用第二分组及第三分组中的字符串
6.在/etc/passwd文件中查找匹配o 并至少出现2次的字符串的行 匹配前面字符至少2次 至少出现2次或者更多次 比如 rooot 也会一起出现的 7.在/etc/fstab文件中以#开头 且后面跟一个或者多个空白字符 而后又跟任意非空白字符的行 8. 显示/etc/fstab文件中的内容 并不显示以#开头和空白行 简单介绍到这里 后续更新 如不足之处 请多多提议 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |