正则表达式、管道和重定向
1、什么是正则表达式 正则表达式是一类字符所书写的模式(pattern)取行:选择,grep,egrep,fgrep 使用正则表达式来描述选择条件 正则表达式:基本正则表达式,扩展正则表达式 元字符:*,?这类字符不表示字符本身的意义,而用于额外功能性的描述 给定选取条件,只显示符合条件的行 grep:默认支持基本正则表达式; egerp:支持扩展正则表达式; fgrep:不支持正则表达式元字符,快速搜索,所有的字符都当做字符本身 grep:简单搜索,全局搜索基本正则表达式 grep [options] 'pattern' FILE #grep'root'/etc/passwd#显示含有root字符串的行 root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin 基本正则表达式的元字符: ^:锚定行首的符合条件的内容,用法格式"^pattern" #grep'^root'/etc/passwd root:x:0:0:root:/root:/bin/bash $:锚定行尾的符合条件的内容,用法格式"pattern$" #grep--color=auto'sh$'/etc/passwd root:x:0:0:root:/root:/bin/bash oracle:x:500:500::/home/oracle:/bin/bash hadoop:x:501:502::/home/hadoop:/bin/bash ^pattern$:以单词开头,并以其结尾 ^$:空白行 .:匹配任意单个字符 *:匹配紧挨在其前面的字符任意次数 a*b:ab,aab,acb,b .*:匹配任意长度的任意字符 []:匹配指定范围内的任意但个字符 [^]:匹配指定范围外的任意单个字符 ?:匹配紧挨在其前面的字符0次或1次 a?b:ab,aab,acb,b {m,n}:匹配其前面的字符至少m次,至多n次 a{1,3}b:b,ab,aab,aaaab,abc {0,n}:至多n次,0-n次 {m,}:至少m次 {m}:精确匹配m次 &;:锚定词首,,用法格式:&;pattern b:bpattern &;:锚定词尾,用法格式:pattern&; b:patternb &;pattern&;:锚定单词 ():分组,用法格式:(pattern) (ab){1,3}:ab,aab,abb,abab,ababab (ab).*1:前面与后面一样 #grep"(gentoo).*1"/etc/passwd gentoo:x:1001:1001:caoyuanlang:/home/gentoo:/bin/bash grep的选项: --color=auto export GREP_COLOR='01;36' 01表示字体颜色(前景色),36表示背景颜色 -v:反向选取,只显示不符合模式的行 -o:只显示被模式匹配到的字符串,而不是正行 -i:匹配时,不区分字符大小写 -A N:显示匹配到的行的时候,顺带显示其后面的N个行 -B N:显示匹配到的行的时候,顺带显示其前面的N个行 -C N:显示匹配到的行的时候,顺带显示其前面和后面的N个行 -E:使用扩展的正则表达式 例: 显示/proc/meminfo文件中以不区分大小的s开头的行; #grep"^[Ss]"/proc/meminfo 显示/etc/passwd中以nologin结尾的行; #grep"nologin$"/etc/passwd #grep"nologin$"/etc/passwd|wc-l#显示有多少行 取出默认shell为/sbin/nologin的用户列表 #grep"nologin$"/etc/passwd|cut-d:-f1 取出默认shell的bash,且其用户ID号最小的用户名 #grep"/bin/bash$"/etc/passwd|sort-n-t:-k3|head-1|cut-d:-f1#-t指定分隔符,-k指定第几个字段进行排序 显示/etc/rc.d/rc.sysinit中以#开头,且后面跟一个或多个空白字符,而后面又跟了任意非空白字符的行 #grep"^#[[:spaec:]]{1,}[^[:space:]]"/etc/rc.d/rc.sysinit 显示/etc/rc.d/rc.sysinit中符合形为“任意单个字符n任意字符任意单个字符n”模式的行:即任意但个字符后面跟了个n,n后面有任意长度的任意字符,而后是任意单个字符后面跟了个n #grep".n.*.n"/etc/rc.d/rc.sysinit 显示/etc/rc.d/rc.sysinit中符合形为“任意单个字符n任意字符任意单个字符n”模式的行:即任意单个字符后面跟了个n,n后面有任意长度的任意字符,而后是任意单个字符后面跟了个n,但后面的n之前的字符要与前面的n之前的字符相同 #grep"(.n).*1"/etc/rc.d/rc.sysinit 显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行 #grep"^#[[:spaec:]]{1,}"/boot/grub/grub.conf 找出某文件中的,1位数,或2位数 #grep"&;[0-9]{1,2}&;"/etc/rc.d/rc.sysinit #grep-w"[0-9]{1,2}"/etc/rc.d/rc.sysinit 找出ifconfig命令结果中的1-255之间的整数 ifconfig | grep #ifconfig|egerp--color=auto"&;([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])&;" 100-199:1[0-9][0-9] 200-249:2[0-4][0-9] 250-255:25[0-5] 查找当前系统上名字为student(必须出现在行首)的用户的账号的相关信息,文件为/etc/passwd #grep"^student:"/etc/passwd 扩展正则表达式元字符: .:任意单个字符 []:匹配指定范围内的任意但个字符 [^]:匹配指定范围外的任意单个字符 *:匹配紧挨在其前面的字符任意次数 +:匹配其前面的字符至少1次 ?:匹配紧挨在其前面的字符0次或1次 {m,n}:至少m次,至多n次 ():分组,支持引用1,2 a|b:二选一 &;:锚定词首,,用法格式:&;pattern b:bpattern &;:锚定词尾,用法格式:pattern&; b:patternb &;pattern&;:锚定单词 ^:锚定行首的符合条件的内容,用法格式"^pattern" $:锚定行尾的符合条件的内容,用法格式"pattern$" #egrep"c|Cat"/root/test.txt c,Cat #egrep"(c|C)at"/root/test.txt cat,Cat fgrep:fist sort:排序 -f:忽略大小写 -n:以数值大小进行排序:默认以ASCII表中的数字大小排序 -r:逆序排序 -u:移除重复的行,具有相同内容的行只保留一个 只有两行一模一样,并且挨着,才算是重复的行 -R:随机排序 -t:指定分隔符 -k:指定用第几个字段进行排序 uniq: -c:统计每行重复的 -u:只显示没有重复的行 -d:只显示重复过的行 #sortsort.txt|uniq-c 1Firstline. 1Fourline. 1Howareyou? 2Secondline. 2Thirdline. #sortsort.txt|uniq-d Secondline. Thirdline. #sortsort.txt|uniq-u Firstline. Fourline. Howareyou? 文本处理三剑客:grep,sed,awk 2、重定向 Linux I/O重定向,管道 I/O:这是一种统称 Linux为应用程序提供了I/O重定向的功能 程序本身要有输入输出的功能 为了安全起见,所以输入输出都标准化了,标准输入是键盘,标准输出是监视器(显示器),错误输出也是监视器 每一个内核打开的文件都有一个文件描述符:file disciptor,FD 标准输入FD:0 标准输出FD:1 错误输出FD:2 将其默认数据流改为其他设备,就称为IO重定向 输出重定向: 1>:覆盖重定向,即覆盖文件里面的内容 1可以省略 set -C:避免覆盖已经存在的文件的内容 set +C:关闭上述功能 1>>:追加重定向 1可以省略 /dev/null:数据黑洞,bit bucket 错误重定向: 2>:覆盖重定向 2>>:追加重定向 ">"改成">>"则表示把输出追加到filename文件的末尾,如果文件不存在则创建它。 同时重定向标准输出和错误输出: COMMAND > /path/to/stdout 2> /path/to/error 标准输出和错误输出定向至一个文件: &> &>> COMMAND &> /path/to/somewhere 或 COMMAND > /path/to/somewhere 2>&1 输入重定向: <: COMMAND < /from/somewhere <<:Here Document,此处创建文档 cat > /path/to/somefile << EOF 通常用于脚本中生成文档 cat << EOF 通常用于脚本中向用户输出大段信息 3、管道 管道:| COMMAND1 | COMMAND2 | COMMAND3 |... 管道的最后一个命令是在当前shell的子shell中执行 多道输出: tee COMMAND1 | tee /path/to/somefile #ifconfig|grep"inetaddr:"|grep-v'127.0.0.1'|cut-d:-f2|cut-d''-f1 192.168.1.1 例: 统计/usr/bin/目录下的文件个数 #ls/usr/bin|wc-l 取出当前系统上所有用户的shell,要求每种shell只显示一次,并且按顺序进行显示 #cut-d:-f7/etc/passwd|sort-u|grep-v"^$" 如何显示/var/log目录下每个文件的内容类型? #file/var/log/*或#cd/var/log;file'ls/var/log' 取出/etc/inittab文件的第5行 #head-5/etc/inittab|tail-1 取出etc/passwd文件中倒数第9个用户的用户名和shell,显示到屏幕上并将其保存至/tmp/users.txt文件中 #tail-9/etc/passwd|head-1|cut-d:-f1,7|tee/tmp/users.txt 显示/etc目录下所有以pa开头的文件,并统计其个数 #ls/etc/pa*|wc-l 不使用文件编辑器,将alias cle=clear一行内容添加至当前用户的.bashrc文尾部 #echo'aliascls=clear'>>~/.bashrc (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |