第十五章 shell正则表达式
见图片
Shell正则表达式
正则表达式的分类
- 基本的正则表达式(Basic Regular Expression 又叫Basic RegEx 简称BREs)
- 扩展的正则表达式(Extended Regular Expression 又叫Extended RegEx 简称EREs)
- Perl的正则表达式(Perl Regular Expression 又叫Perl RegEx 简称PREs)
基本组成部分
正则表达式的基本组成部分。
正则表达式 |
描述 |
示例 |
Basic RegEx |
Extended RegEx |
Python RegEx |
Perl regEx |
|
转义符,将特殊字符进行转义,忽略其特殊意义 |
a .b匹配a.b,但不能匹配ajb,点被转义为特殊意义 |
|
|
|
|
^ |
匹配行首,awk中,^则是匹配是字符串的开始 |
^tux匹配以tux开头的行 |
^ |
^ |
^ |
^ |
$ |
匹配行尾,awk中,$则是匹配字符串的结尾 |
tux$匹配以tux结尾的行 |
$ |
$ |
$ |
$ |
. |
匹配除换行符n之外的任意单个字符,awk中则可以 |
ab.匹配abc或abd,不可匹配abcd或abde,只能匹配单字符 |
. |
. |
. |
. |
[] |
匹配包含在[字符]之中的任意一个字符 |
coo[kl]可以匹配cook或cool |
[] |
[] |
[] |
[] |
[^] |
匹配[^字符]之外的任意一个字符 |
123[^45]不可以匹配1234或1235,1236/1237都可以 |
[^] |
[^] |
[^] |
[^] |
[-] |
匹配[]中指定范文内的任意一个字符,要写成递增 |
[0-9]可以匹配1、2、或3等其中任意一个数字 |
[-] |
[-] |
[-] |
[-] |
? |
匹配之前的项 1次或者0次 |
colou?r可以匹配color或者colour,不能匹配colouur |
不支持 |
? |
? |
? |
+ |
匹配之前的项 1次或者多次 |
sa-6+匹配sa-6、sa-666,不能匹配sa- |
不支持 |
+ |
+ |
+ |
* |
匹配之前的项 0次或者多次 |
co*l匹配cl、col、cool、coool等 |
* |
* |
* |
* |
() |
匹配表达式,创建一个用于匹配的子串**** |
max(tri)?匹配max或者maxtri |
不支持 |
() |
() |
() |
{n} |
匹配之前的项 n次,n是可以为0的正整数 |
[0-9]{3}匹配任意一个三位数,可以扩展为3个[0-9] |
不支持 |
{n} |
{n} |
{n} |
{n,} |
之前的项 至少需要匹配n次 |
[0-9]{2,}匹配任意一个两位数或多位数 |
不支持 |
{n,} |
{n,} |
{n,m} |
指定之前的项至少匹配n次,最多匹配m次,n<m |
[0-9]{2,5}匹配从两位数到五位数之间的任意一个数字 |
不支持 |
{n,m} |
{n,m} |
| |
交替匹配|两边的任意一项 |
ab(c|d)匹配abc或abd |
不支持 |
| |
| |
| |
POSIX字符类
POSIX字符类是一个形如[:...:]的特殊元序列(meta sequence),他可以用于匹配特定的字符范围。
正则表达式 |
描述 |
示例 |
Basic RegEx |
Extended RegEx |
Python RegEx |
Perl regEx |
[:alnum] |
匹配任意一个字母或数字字符 |
[[:alnum]]+<br />匹配一个或多个字母或数字 |
[:alnum] |
[:alnum] |
[:alnum] |
[:alnum] |
[:alpha:] |
匹配任意一个字母字符(包括大小写字母) |
[[:alpha:]]{4}<br />匹配任意3个字母 |
[:alpha:] |
[:alpha:] |
[:alpha:] |
[:alpha:] |
[:blank:] |
空格与制表符(横向和纵向) |
[[:blank:]]*<br />匹配0次或多次 空格与制表符 |
[:blank:] |
[:blank:] |
[:blank:] |
[:blank:] |
[:digit:] |
匹配任意一个数字字符 |
[[:digit:]]?<br />匹配0或1个数字 |
[:digit:] |
[:digit:] |
[:digit:] |
[:digit:] |
[:lower:] |
匹配小写字母 |
[[:lower:]]{5,}<br />匹配至少5个小写字母或5个以上小写字母 |
[:lower:] |
[:lower:] |
[:lower:] |
[:lower:] |
[:upper:] |
匹配大写字母 |
([[:upper:]]+)?<br />匹配一个大写字母或者多个大写字母 出现过0次或者1次 |
[:upper:] |
[:upper:] |
[:upper:] |
[:upper:] |
[:punct:] |
匹配标点符号 |
[[:punct:]] |
[[:punct:]] |
[[:punct:]] |
[[:punct:]] |
[[:punct:]] |
[:space:] |
匹配一个包括换行符、回车等在内的所有空白符 |
[[:space:]]+ |
[:space:] |
[:space:] |
[:space:] |
[:space:] |
[:graph:] |
匹配任何一个可以看得见的且可以打印的字符 |
[[:graph:]] |
[:graph:] |
[:graph:] |
[:graph:] |
[:graph:] |
[:xdigit:] |
任何一个十六进制数(即:0-9,a-f,A-F) |
[[:xdigit:]]+ |
[:xdigit:] |
[:xdigit:] |
[:xdigit:] |
[:xdigit:] |
[:cntrl:] |
任何一个控制字符(ASCII字符集中的前32个字符) |
[[:cntrl:]] |
[:cntrl:] |
[:cntrl:] |
[:cntrl:] |
[:cntrl:] |
[:print:] |
任何一个可以打印的字符 |
[[:print:]] |
[:print:] |
[:print:] |
[:print:] |
[:print:] |
元字符
元字符(meta character)是一种Perl风格的正则表达式,只有一部分文本处理工具支持它,并不是所有的文本处理工具都支持。
正则表达式 |
描述 |
示例 |
Basic RegEx |
Extended RegEx |
Python RegEx |
Perl regEx |
b |
单词边界 |
bcoolb 匹配cool,不匹配coolant |
b |
b |
b |
b |
B |
非单词边界 |
coolB 匹配coolant,不匹配cool |
B |
B |
B |
B |
d |
单个数字字符 |
bdb 匹配b2b,不匹配bcb |
不支持 |
不支持 |
d |
d |
D |
单个非数字字符 |
bDb 匹配bcb,不匹配b2b |
不支持 |
不支持 |
D |
D |
w |
单个单词字符(字母、数字与_) |
w 匹配1或a或_,不匹配@ |
w |
w |
w |
w |
W |
单个非单词字符 |
W 匹配@,不匹配1或a或_ |
W |
W |
W |
W |
n |
换行符 |
n 匹配一个新行 |
不支持 |
不支持 |
n |
n |
s |
单个空白字符 |
Xsx 匹配x x,不匹配xx |
不支持 |
不支持 |
s |
s |
S |
单个非空白字符 |
xSx 匹配xkx,不匹配xx |
不支持 |
不支持 |
S |
S |
r |
回车 |
r 匹配回车 |
不支持 |
不支持 |
r |
r |
t |
横向制表符 |
t 匹配一个横向制表符 |
不支持 |
不支持 |
t |
t |
v |
垂直制表符 |
v 匹配一个垂直制表符 |
不支持 |
不支持 |
v |
v |
f |
换页符 |
f 匹配一个换页符 |
不支持 |
不支持 |
f |
f |
(编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|