加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

Perl 字符串处理

发布时间:2020-12-15 20:58:58 所属栏目:大数据 来源:网络整理
导读:1. chop和chomp函数 两个函数都以字符串作为参数,并去除其末尾最后一个字符。区别是,无论最后一个字符是什么,chop都会去除,并在返回值中返回;而仅当字符串最后一个字符与特殊变量$/保存的字符一样时,chomp才会将其去除。默认情况下$/保存换行字符,当

1. chop和chomp函数

  两个函数都以字符串作为参数,并去除其末尾最后一个字符。区别是,无论最后一个字符是什么,chop都会去除,并在返回值中返回;而仅当字符串最后一个字符与特殊变量$/保存的字符一样时,chomp才会将其去除。默认情况下$/保存换行字符,当然可以重设。

  1)如果函数参数是一个字符串数组,那么函数会分别对数组中的每个元素调用。

  2)如果函数参数是一个符合列表(即列表中还有其他列表或HASH表),则可以认为保存在参数列表中的是每个复合容器的地址(指针),而此时chop会将地址作为一个字符串处理,从而破坏整个复合列表。

  顺带一提,如果一个变量是保存数值类型,而非字符串,该函数会把变量保存的数值解释成字符串。

2. getc函数

  getc函数的参数只有一个,就是文件句柄,如果要从标准输入流读入,就使用STDIN。该函数返回读取的字节,要注意的是,如果读取的是文件流,则在EOF处函数返回空字符串,即'';如果读取标准输入流,则会一直阻塞。

3.拼接字符串

  使用join函数可以拼接各个字符串,签名为join(delmiter,list)。其中delimiter是一个分隔字符串,在拼接结果中各个分离字符串以该delimiter分隔;list则是各个分离的字符串,也可以是一个保存着若干字符串的数组。

  $str1 = "stringA" ; ?$str2 = "stringB";

  $combine = join '::',$str1,$str2 ; ?#$combine值为::stringA::stringB

  @list1 = ( $str1,$str2 ); ?@list2 = qw ( stringC ?stringD );

  $combine = join '_',@list1,@list2,$str1 ; ?#$combine值为_stringA_stringB_stringC_stringD_stringA

  分隔符使用"n"时,就可以拼接成垂直列表了。

4.分割字符串

  使用split函数进行字符串分割。

  split(delimiter,string,count)

  delimiter是分隔符,默认是空格(以tab,空格等进行分割)

  string是被分割的字符串,不指定该参数时,对$_进行分割

  count允许分割的最大份数,当实际可以分割的份数超过该值时,第count份子串将保存剩余的字符串

  函数返回一个数组,里面保存分割的所有字串

5.重复拼接字符串

  Perl中的 x 操作符,注意操作数必须左边可解析成字符串,右边可解析成数值。

    $str1 = "abc";

    $str2 = $str1 x 5; ? # $str2的值为 "abcabcabcabcabc"

6.字串替换

  substr(string,offset,length):

  string:原字符串 , offset:字串所在原字符串中的起始位置 , length:字串长度

  该函数有两种用法:

    1)获取子串

      ??$str = "abcdefghijk";

      ? $sstr = substr( $str,5,3 ); ? # $sstr的值为"efg"

    2)替换子串

      $str = "1234567890";

      substr( $str,4,?3) = "xxxxx" ; # $str的值为"123xxxxx7890"

      函数的第三个参数指定的是被替换子串的长度,因此不影响新替换的字串的长度.

? ? ? ? ?3) ?截取字符串末尾字符。

? ? ? ? ? ? ?假如我们想截取掉一个字符串的末尾若干个字符。比如,"aaa_1111_SC","b_22_SC","ccccc_3333333_SC".这种情况下,字符长度都不同,假如我们想去掉字符串的末尾"_SC“,那我们怎么办呢?

? ? ? ? ? ? ?在Perl中允许我们从末尾开始计数,比如截取"aaa_111_SC"的末尾后三位字符"_SC",我们可以用:?

substr("aaa_111_SC",-3,3)="";

? ? 得到的结果将是"aaa_111".很成功的去掉了末尾的"_SC".

? ? ? ? ? ? 这对于不定字符串长度的公共项约除有很大的帮助。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读