- x (这里 x 是指其不是这些转义字符 ^$()%.[]*+-? 之一) --- 其代表了这个字符本身.
- . --- 代表任何字符
- %a --- 代表任何字母. 即[a-zA-Z]
- %c --- 代表任何的控制字符.
- %d ---代表任何的数字字符. 即[0-9]
- %l --- 代表所有的小写字母. 即[a-z]
- %p --- 代表所有的标点符号字符.
- %s --- 代表所有空格,tab 字符.
- %u --- 代表所有的大写字母. 即[A-Z]
- %w --- 代表所有的字母数字. 即[a-zA-Z0-9]
- %x --- 代表16进制数字.
- %z --- 代表字符值是 0 的字符. 注意:值为0 的字符是无法正常表达的在表达式中,如果你要使用他,请使用 %z .
- %x (x是任何非字母和数字的字符) --- 代表字符 x. 这是一种标准的方式来代表应用转义字符. 任何标点符号字符(即使不是转义字符) 在其前面添加一个 % 可以用来表示其自己 例如 %% 表示 %,%$ 表示 $.
- [set] --- 代表一个字符集合. 如果要表达一个范围集合,在范围开始的字符和结尾的字符之间使用 -,例如要表达 3,4,5,6 这个集合 可以用 [3456],也可以用 [3-6] .上面提到的 %x 也可以用到集合中. 例如,[%w_] 表达所有的字母和数字加一个下划线.
- [^set] --- 表达所有不出现在集合内的.
总的来说,在Lua中的正则表达式与C#中的是相似的,只是转义字符由/变成了%。
Lua中的正则表达式语言限定符:
- * -- matches 0 or more repetitions of x. Will always match the longest possible chain.
- + -- matches 1 or more repetitions of x. Will always match the longest possible chain.
- - -- matches 0 or more repetitions of x. Will always match the shortest possible chain.
- ? -- matches 0 or 1 occurence of x.
另外一些用法:
- %n -- n must be a number between 1 and 9. Matches the nth captured substring (see below)
- %bxy -- matches a substring starting with x and ending with y. The substring must also have the same number of x and y.
- ^ -- When at the beginning of a pattern,it forces the pattern to match the beginning of a string
- $ -- When at the end of a pattern,it forces the pattern to match the end of a string
- When ^ or $ is anywhere else in a pattern,it has no special meaning.