加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

Lua中的字符串函数库

发布时间:2020-12-14 22:01:50 所属栏目:大数据 来源:网络整理
导读:Lua解释器对字符串的支持很有限。一个程序可以创建字符串并连接字符串,但不能截取子串,检查字符串的大小,检测字符串的内容。在Lua中操纵字符串的功能基本来自于string库。 字符串库中的一些函数是非常简单的: string. len (s)????????? 返回字符串s的长

Lua解释器对字符串的支持很有限。一个程序可以创建字符串并连接字符串,但不能截取子串,检查字符串的大小,检测字符串的内容。在Lua中操纵字符串的功能基本来自于string库。

字符串库中的一些函数是非常简单的:

string.len(s)????????? 返回字符串s的长度;
rep(s,n)??????返回重复n次字符串s的串;你使用string.rep("a",2^20)可以创建一个1M bytes的字符串(比如,为了测试需要);
lower(s)?????? 将s中的大写字母转换成小写(string.upper将小写转换成大写)。如果你想不关心大小写对一个数组进行排序的话,你可以这样:
?????????????????????????????table.sort(a,function (a,b)?return?string.lower(a) <?string.lower(b)?end)
string.upper(s)?????? 将s中的小写字母转换成大写
????????????????????????????string.upperstring.lower都依赖于本地环境变量。所以,如果你在 European Latin-1环境下,表达式:
????????????????????????????string.upper("a??o")????--> "A??O"
string.sub(s,i,j)??????函数截取字符串s的从第i个字符到第j个字符之间的串。Lua中,字符串的第一个字符索引从1开始。你也可以使用负索引,负索引从字符串的结尾向前计数:-1指向最后一个字符,-2指向倒数第二个,以此类推。所以,?string.sub(s,1,j)返回字符串s的长度为j的前缀;string.sub(s,j,-1)返回从第j个字符开始的后缀。如果不提供第3个参数,默认为-1,因此我们将最后一个调用写为string.sub(s,j);string.sub(s,2,-2)返回去除第一个和最后一个字符后的子串。
s = "[in brackets]"
print(string.sub(s,-2)) --> in brackets
记住:Lua中的字符串是恒定不变的。string.sub函数以及Lua中其他的字符串操作函数都不会改变字符串的值,而是返回一个新的字符串。一个常见的错误是:
string.sub(s,-2)
认为上面的这个函数会改变字符串s的值。如果你想修改一个字符串变量的值,你必须将变量赋给一个新的字符串:
s =?string.sub(s,-2)
string.char函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s,i)将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。下面的例子中,我们假定字符用ASCII表示:

string.char(97)) --> a
i = 99; print((i,i+1,i+2)) --> cde
string.byte("abc")) --> 97
("abc",2)) --> 98


上面最后一行,我们使用负数索引访问字符串的最后一个字符。

Lua提供了string.format()函数来生成具有特定格式的字符串,函数的第一个参数是格式(formatstring),之后是对应格式中每个代号的各种数据. 由于格式字符串的存在,使得产生的长字符串可读性大大提高了. 这个函数的格式很像C语言中的printf().函数string.format在用来对字符串进行格式化的时候,特别是字符串输出,是功能强大的工具。这个函数有两个参数,你完全可以照C语言的printf来使用这个函数。第一个参数为格式化串:由指示符和控制格式的字符组成。指示符后的控制格式的字符可以为:十进制'd';十六进制'x';八进制'o';浮点数'f';字符串's'。在指示符'%'和控制格式字符之间还可以有其他的选项:用来控制更详细的格式,比如一个浮点数的小数的位数:

格式字符串可能包含以下的转义码:

%c - 接受一个数字,并将其转化为ASCII码表中对应的字符
%d,%i - 接受一个数字并将其转化为有符号的整数格式
%o - 接受一个数字并将其转化为八进制数格式
%u - 接受一个数字并将其转化为无符号整数格式
%x - 接受一个数字并将其转化为十六进制数格式,使用小写字母
%X - 接受一个数字并将其转化为十六进制数格式,使用大写字母
%e - 接受一个数字并将其转化为科学记数法格式,使用小写字母e
%E - 接受一个数字并将其转化为科学记数法格式,使用大写字母E
%f - 接受一个数字并将其转化为浮点数格式
%g(%G) - 接受一个数字并将其转化为%e(%E,对应%G)及%f中较短的一种格式
%q - 接受一个字符串并将其转化为可安全被Lua编译器读入的格式
%s - 接受一个字符串并按照给定的参数格式化该字符串

为进一步细化格式,可以在%号后添加参数. 参数将以如下的顺序读入:

(1) 符号: 一个+号表示其后的数字转义符将让正数显示正号. 默认情况下只有负数显示符号.
(2) 占位符: 一个0,在后面指定了字串宽度时占位用. 不填时的默认占位符是空格.
(3) 对齐标识: 在指定了字串宽度时,默认为右对齐,增加-号可以改为左对齐.
(4) 宽度数值
(5) 小数位数/字串裁切: 在宽度数值后增加的小数部分n,若后接f(浮点数转义符,如%6.3f)则设定该浮点数的小数只保留n位,若后接s(字符串转义符,如%5.3s)则设定该字符串只显示前n位.

在这些参数的后面则是上述所列的转义码类型(c,d,f,...).


string.format("pi = %.4f",PI))
????? --> pi = 3.1416
d = 5; m = 11; y = 1990
("%02d/%02d/%04d",m,y))
??????? --> 05/11/1990
tag,title = "h1","a title"
("<%s>%s</%s>",tag,title,tag))
??????? --> <h1>a title</h1>

第一个例子,%.4f代表小数点后面有4位小数的浮点数。第二个例子%02d代表以固定的两位显示十进制数,不足的前面补0。而%2d前面没有指定0,不足两位时会以空白补足。对于格式串部分指示符得详细描述清参考lua手册,或者参考C手册,因为Lua调用标准C的printf函数来实现最终的功能。

以下是一些例子:


string.format("%%c: %c",83)????????????输出S
string.format("%+d",17.0)??????????????输出+17
string.format("%05d",17)?????????????? 输出00017
string.format("%o",17)?????????????????输出21
string.format("%u",3.14)?????????????? 输出3
string.format("%x",13)?????????????????输出d
string.format("%X",13)?????????????????输出D
string.format("%e",1000)?????????????? 输出1.000000e+03
string.format("%E",1000)???????????????输出1.000000E+03
string.format("%6.3f",13)????????????? 输出13.000
string.format("%q","OnenTwo")?????????输出"One
????????????????????????????????????????  Two"
string.format("%s","monkey")???????????输出monkey
string.format("%10s","monkey")?????????输出??? monkey
string.format("%5.3s","monkey")??????? 输出? mon

-------------------------------------------------------------------------------------------------------

--lua中字符串索引从前往后是1,……,从后往前是-1,-2……。
--string库中所有的function都不会直接操作 字符串,只返回一个结果。
--------------------------------------------------------------------------------------------------
【基本函数】


函数 描述 示例 结果
len 计算字符串长度 string.len("abcd") 4
rep 返回字符串s的n个拷贝 string.rep("abcd",2) abcdabcd
lower 返回字符串全部字母大写 string.lower("AbcD") abcd
upper 返回字符串全部字母小写 string.upper("AbcD") ABCD
format 返回一个类似printf的格式化字符串 string.format("the value is:%d",4) the value is:4
sub returns substring from index i to j of s string.sub("abcd",sans-serif; line-height:18px; border-left-style:none; border-top-style:none"> bcd
string.sub("abcd",-2) cd
bc
bc
find 在字符串中查找 string.find("cdcdcdcd","ab") nil
string.find("cdcdcdcd","cd") 1?2
7?8
gsub 在字符串中替换 string.gsub("abcdabcd","a","z"); zbcdzbcd?2
string.gsub("aaaa","z",3); zzza?3
byte 返回字符的整数形式 string.byte("ABCD",sans-serif; line-height:18px"> 68
char 将整型数字转成字符并连接 string.char(97,98,99,100) abcd
--------------------------------------------------------------------------------------------------
【基本模式串】

字符类 描述 示例 结果
. 任意字符 string.find("",".") nil
%s 空白符 string.find("ab?cd","%s%s") 3?4
%S 非空白符 1?2
%p 标点字符 string.find("ab,.cd","%p%p") %P 非标点字符 %c 控制字符 string.find("abcdtn","%c%c") 5?6
%C 非控制字符 string.find("tnabcd","%C%C") %d 数字 string.find("abcd12","%d%d") %D 非数字 string.find("12abcd","%D%D") %x 十六进制数字 string.find("efgh","%x%x") %X 非十六进制数字 %a 字母 string.find("AB12","%a%a") %A 非字母 %l 小写字母 string.find("ABab","%l%l") %L 大写字母 %u %U 非大写字母 %w 字母和数字 string.find("a1()","%w%w") %W 非字母非数字 3?4
【转义字符%
结果
% 转义字符 string.find("abc%..","%%") 4?4
string.find("abc..d","%.%.") 4?5
【用[]创建字符集,"-"为连字符,"^"表示字符集的补集】
[01] 匹配二进制数 string.find("32123","[01]") 3?3 [AB][CD] 匹配AC、AD、BC、BD string.find("ABCDEF","[AB][CD]") 2?3 [[]] 匹配一对方括号[] string.find("ABC[]D","[[]]") 4?5 [1-3] 匹配数字1-3 string.find("312","[1-3][1-3][1-3]") 1?3 [b-d] 匹配字母b-d string.find("dbc","[b-d][b-d][b-d]") [^%s] 匹配任意非空字符 string.find("?a?","[^%s]") [^%d] 匹配任意非数字字符 string.find("123a","[^%d]") [^%a] 匹配任意非字母字符 string.find("abc1","[^%a]") 4?4
【用"()"进行捕获】

字符类 描述 示例 结果
() 捕获字符串 string.find("12ab","(%a%a)") 3?4?ab
string.find("ab12","(%d%d)") 3?4?12
--------------------------------------------------------------------------------------------------
【模式修饰符】
修饰符 + 表示1个或多个,匹配最多个 string.find("aaabbb","(a+b)") 1?4?aaab string.find("cccbbb",sans-serif; line-height:18px"> nil - 表示0个或多个,匹配最少个 string.find("zzxyyy","(xy-)") 3?3?x string.find("zzzyyy","(x-y)") 4?4?y * 表示0个或多个,匹配最多个 string.find("mmmnnn","(m*n)") 1?4?mmmb string.find("lllnnn",sans-serif; line-height:18px"> 4?4?n ? 表示0个或1个 3?4?ab 4?4?b

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

相关内容
推荐文章
站长推荐
热点阅读