正则表达式

发布时间：2020-12-13 23:07:13 所属栏目：百科来源：网络整理

导读：什么是正规表示法正规表示法就是处理字串的方法，他是以行为单位来进行字串的处理行为，正规表示法透过一些特殊符号的辅助，可以让使用者轻易的达到『搜寻/删除/取代』某特定字串的处理程序！ [:alnum:]代表英文大小写字节及数字，亦即0-9,A-Z,a-z [:alpha:

什么是正规表示法

正规表示法就是处理字串的方法，他是以行为单位来进行字串的处理行为，正规表示法透过一些特殊符号的辅助，可以让使用者轻易的达到『搜寻/删除/取代』某特定字串的处理程序！

[:alnum:]代表英文大小写字节及数字，亦即0-9,A-Z,a-z

[:alpha:]代表任何英文大小写字节，亦即A-Z,a-z

[:blank:]代表空白键与[Tab]按键两者

[:digit:]代表数字而已，亦即0-9

[:lower:]代表小写字节，亦即a-z

[:upper:]代表大写字节，亦即A-Z

[:space:]任何会产生空白的字节，包括空白键,[Tab],CR等等

regular_express.txt

"OpenSource"isagoodmechanismtodevelopprograms.

appleismyfavoritefood.

Footballgameisnotusefeetonly.

thisdressdoesn'tfitme.

However,thisdressisabout$3183dollars.^M

GNUisfreeairnotfreebeer.^M

Herhairisverybeauty.^M

Ican'tfinishthetest.^M

Oh!Thesouptastegood.^M

motorcycleischeapthancar.

Thiswindowisclear.

thesymbol'*'isrepresentedasstart.

Oh!Mygod!

Thegdsoftwareisalibraryfordraftingprograms.^M

Youarethebestismeanyouaretheno.1.

Theworld<Happy>isthesamewith"glad".

Ilikedog.

googleisthebesttoolsforsearchkeyword.

goooooogleyes!

go!go!Let'sgo.

^word意义：待搜寻的字串(word)在行首！

范例：搜寻行首为#开始的那一行，并列出行号

grep-n'^#'regular_express.txt

word$意义：待搜寻的字串(word)在行尾！

范例：将行尾为!的那一行列印出来，并列出行号

grep-n'!$'regular_express.txt

.意义：代表『一定有一个任意字节』的字符！

范例：搜寻的字串可以是(eve)(eae)(eee)(ee)，但不能仅有(ee)！

亦即e与e中间『一定』仅有一个字节，而空白字节也是字节！

grep-n'e.e'regular_express.txt

意义：跳脱字符，将特殊符号的特殊意义去除！

范例：搜寻含有单引号'的那一行！

grep-n'regular_express.txt

*意义：重复零个到无穷多个的前一个RE字符

范例：找出含有(es)(ess)(esss)等等的字串，注意，因为*可以

是0个，所以es也是符合带搜寻字串。

另外，重复『前一个RE字符』的符号，因此，在*之前必须要紧接著一

个RE字符喔！例如任意字节则为.*

grep-n'ess*'regular_express.txt

[list]意义：字节集合的RE字符，里面列出想要撷取的字节！

范例：搜寻含有(gl)或(gd)的那一行，需要特别留意的是，在[]当中

『谨代表一个待搜寻的字节』，例如『a[afl]y』代表搜寻的字串可以

是aay,afy,aly即[afl]代表a或f或l的意思！

grep-n'g[ld]'regular_express.txt

[n1-n2]意义：字节集合的RE字符，里面列出想要撷取的字节范围！

范例：搜寻含有任意数字的那一行！需特别留意，在字节集合[]中的减

号-是有特殊意义的，他代表两个字节之间的所有连续字节！但这个连续

与否与ASCII编码有关，因此，你的编码需要配置正确(在bash当中，需

要确定LANG与LANGUAGE的变量是否正确！)例如所有大写字节则

[A- Z]

grep-n'[A-Z]'regular_express.txt

[^list]意义：字节集合的RE字符，里面列出不要的字串或范围！

范例：搜寻的字串可以是(oog)(ood)但不能是(oot)，那个^在[]内

时，代表的意义是『反向选择』的意思。

例如，我不要大写字节，则为 [^A-Z]。但是，需要特别注意的是，如果

以 grep-n[^A-Z] regular_express.txt来搜寻，却发现该文件内的所有

行都被列出，为什么？因为这个[^A-Z]是非大写字节』的意思，因为每

一行均有非大写字节，例如第一行"Opensou rce"就有p,e,n,o....等等的

小写字

grep-n'oo[^t]'regular_express.txt

{n,m}意义：连续n到m个的『前一个RE字符』

意义：若为{n}则是连续n个的前一个RE字符，

意义：若是{n,}则是连续n个以上的前一个RE字符！范例：

在g与g之间有2个到3个的o存在的字串，亦即(goog)(gooog)

grep-n'go{2,3}g'regular_express.txt

&;意义：待搜寻的字串（word)在词首

&;意义：待搜寻的字串(word)在词尾

延伸正规表示法

+意义：重复『一个或一个以上』的前一个RE字符
范例：搜寻(god)(good)(goood)...等等的字串。那个o+代表『一个以上

的o』所以，底下的运行成果会将第 1,9,13行列出来。

egrep-n'go+d'regular_express.txt

?意义：『零个或一个』的前一个RE字符

范例：搜寻(gd)(god)这两个字串。那个o?代表『空的或1个o』

所以，上面的运行成果会将第13,14行列

出来。有没有发现到，这两个案例('go+d'与'go?d')的结果集合

与'go*d'相同？想想看，这是为什么喔！^_^

egrep-n'go?d'regular_express.txt

|意义：用或(or)的方式找出数个字串

范例：搜寻gd或good这两个字串，注意，是『或』！所以，第1,14这

三行都可以被列印出来喔！那如果还想要找出dog呢？

egrep-n'gd|good'regular_express.txt

egrep-n'gd|good|dog'regular_express.txt

()意义：找出『群组』字串

范例：搜寻(glad)或(good)这两个字串，因为g与d是重复的，所以，我

就可以将la与oo列於()当中，并以 |来分隔开来，就可以啦！

egrep-n'g(la|oo)d'regular_express.txt

()+意义：多个重复群组的判别

范例：将『AxyzxyzxyzxyzC』用echo叫出，然后再使用如下的方法搜寻一下

echo'AxyzxyzxyzxyzC'|egrep'A(xyz)+C'

上面的例子意思是说，我要找开头是A结尾是C，中间有一个以上"xyz"字

串的意思～

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!