本文和大家重点讨论一下Perl二维数组的概念和用法,前面的例子里我们创建了包含有固定数据的Perl二维数组,但是如何往其中添加新元素呢?再或者如何从零开始创建一个Perl二维数组呢?本文回味大家一一讲解。
Perl二维数组
最新版本可以从这里获取(POD格式):
http://svn.Perlchina.org/trunk/POD2-CN/lib/POD2/CN/Perllol.pod
Perllol-操作数组的数组(Perl二维数组)
声明和访问数组的数组
创建一个数组的数组(有时也可以叫“列表的列表”,不过不太准确)真是再简单也不过了。它相当容易理解,并且本文中出现的每个例子都有可能在实际应用中出现。
数组的数组就是一个普通的数组(@AoA),不过可以接受两个下标("$AoA[3][2])。
下面先定义一个这样的数组:"
#一个包含有“指向数组的引用”的数组
?
- @AoA=( ?
- ["fred","barney"],?
- ["george","jane","elroy"],?
- ["homer","marge","bart"],?
- ); ?
- ?
- print$AoA[2][2]; ?
- bart?
你可能已经注意到,外面的括号是圆括号,这是因为我们想要给数组赋值,所以需要圆括号。如果你*不*希望这里是@AoA,而是一个指向它的引用,那么就得这样:
#一个指向“包含有数组引用的数组”的引用
?
- $ref_to_AoA=[ ?
- ["fred","barney","pebbles","bambam","dino",],?
- ["homer","bart","maggie",?
- ["george","elroy","judy",?
- ]; ?
- ?
- print$ref_to_AoA->[2][2]; ?
- ?
注意外面的括号现在变成了方括号,并且我们的访问语法也有所改变。这时因为和C不同,在Perl中你不能自由地交换数组和引用(在C中,数组和指针在很多地方可以互相代替使用)。$ref_to_AoA是一个数组引用,而@AoA是一个数组。同样地,$AoA[2]也不是一个数组,而是一个数组引用。所以下面这两行:
$AoA[2][2]
$ref_to_AoA->[2][2]
也可以用这两行来代替:
$AoA[2]->[2]
$ref_to_AoA->[2]->[2]
这是因为这里有两个相邻的括号(不管是方括号还是花括号),所以你可以随意地省略箭头符号。但是如果$ref_to_AoA后面的那个箭头不能省略,因为省略了就没法知道$ref_to_AoA到底是引用还是数组了^_^。
修改Perl二维数组
前面的例子里我们创建了包含有固定数据的Perl二维数组,但是如何往其中添加新元素呢?再或者如何从零开始创建一个Perl二维数组呢?
首先,让我们试着从一个文件中读取Perl二维数组。首先我们演示如何一次性添加一行。首先我们假设有这样一个文本文件:每一行代表了Perl二维数组的行,而每一个单词代表了Perl二维数组的一个元素。下面的代码可以把它们储存到@AoA:
while(<>){
@tmp=split;
push@AoA,[@tmp];
}
你也可以用一个函数来一次读取一行:
for$i(1..10){
$AoA[$i]=[somefunc($i)];
}
或者也可以用一个临时变量来中转一下,这样看起来更清楚些:
for$i(1..10){
@tmp=somefunc($i);
$AoA[$i]=[@tmp];
}
注意方括号"[]"在这里非常重要。方括号实际上是数组引用的构造器。如果不用方括号而直接写,那就犯了很严重的错误:$AoA[$i]=@tmp;
你看,把一个数组赋值给了一个标量,那么其结果只是计算了@tmp数组的元素个数,我想这肯定不是你希望的。
如果你打开了"usestrict",那么你就得先定义一些变量然后才能避免警告:
- usestrict; ?
- my(@AoA,@tmp); ?
- while(<>){ ?
- @tmp=split; ?
- push@AoA,[@tmp]; ?
- } ?
- ?
当然,你也可以不要临时变量:
while(<>){
push@AoA,[split];
}
如果你知道想要放在什么地方的话,你也可以不要push(),而是直接进行赋值:
- my(@AoA,$i,$line); ?
- for$i(0..10){ ?
- $line=<>; ?
- $AoA[$i]=[split'',$line]; ?
- } ?
- ?
甚至是这样:
for$i(0..10){ ?
$AoA[$i]=[split'',<>]; ?
}?
你可能生怕<>在列表上下文会出差错,所以想要明确地声明要在标量上下文中对<>求值,这样可读性会更好一些:(译者注:列表上下文中,<>返回所有的行,标量上下文中<>只返回一行。)
my(@AoA,$i);
for$i(0..10){
$AoA[$i]=[split'',scalar(<>)];
}
如果你想用$ref_to_AoA这样的一个引用来代替数组,那你就得这么写:
while(<>){
push@$ref_to_AoA,254)"> 现在你已经知道如何添加新行了。那么如何添加新列呢?如果你正在做数学中的矩阵运算,那么要完成类似的任务:
- for$x(1..10){ ?
- for$y(1..10){ ?
- $AoA[$x][$y]=func($x,$y); ?
- } ?
- } ?
- ?
- for$x(3,7,9){ ?
- $AoA[$x][20]+=func2($x); ?
- } ?
- ?
想要访问的某个元素是不是存在是无关紧要的:因为如果不存在那么Perl会给你自动创建!新创建的元素的值是"undef"。
如果你想添加到一行的末尾,你可以这么做:
#添加新列到已存在的行
push@{$AoA[0]},"wilma","betty";
注意我*没有*这么写:
push$AoA[0],"betty";#错误!
事实上,上面这句根本就没法通过编译!为什么?因为push()的第一个参数必须是一个真实的数组,不能是引用。
访问和打印
现在是打印Perl二维数组的时候了。那么怎么打印?很简单,如果你只想打印一个元素,那么就这么来一下:
print$AoA[0][0];
如果你想打印整个数组,那你可不能这样:print@AoA;#错误!
因为你这么做只能得到一列引用,Perl从来都不会自动地为你解引用。作为替代,你必须得弄个循环或者是双重循环。用shell风格的for()语句就可以打印整个Perl二维数组:
- for$aref(@AoA){ ?
- print"t[@$aref],n"; ?
- }?
如果你要用下标来遍历的话,你得这么做:
- for$i(0..$#AoA){ ?
- print"telt$iis[@{$AoA[$i]}],254)"> 或者这样用双重循环(注意内循环):
- for$i(0..$#AoA){ ?
- for$j(0..$#{$AoA[$i]}){ ?
- print"elt$i$jis$AoA[$i][$j]n"; ?
- } ?
- }?
如同你看到的一样,它有点儿复杂。这就是为什么有时候用临时变量能够看起来更简单一些的原因:
- for$i(0..$#AoA){ ?
- $aref=$AoA[$i]; ?
- for$j(0..$#{$aref}){ ?
- print"elt$i$jis$AoA[$i][$j]n"; ?
- } ?
- } ?
- ?
哦,好像还有点复杂,那么试试这样:
- for$i(0..$#AoA){ ?
- $aref=$AoA[$i]; ?
- $n=@$aref-1; ?
- for$j(0..$n){ ?
- print"elt$i$jis$AoA[$i][$j]n"; ?
- } ?
- }?
切片
切片是指数组的一部分。如果你想要得到多维数组的一个切片,那你得进行一些下标运算。通过箭头可以方便地为单个元素解引用,但是访问切片就没有这么好的事了。当然,我们可以通过循环来取切片。
我们先演示如何用循环来获取切片。我们假设@AoA变量的值和前面一样。
@part=();
$x=4;
for($y=7;$y<13;$y++){
push@part,$AoA[$x][$y];
}
这个循环其实可以用一个切片操作来代替:
@part=@{$AoA[4]}[7..12];
不过这个看上去似乎略微有些复杂。
下面再教你如何才能得到一个*二维切片*,比如$x从4到8,$y从7到12,应该怎么写?
- ?@newAoA=(); ?
- for($startx=$x=4;$x<=8;$x++){ ?
- for($starty=$y=7;$y<=12;$y++){ ?
- $newAoA[$x-$startx][$y-$starty]=$AoA[$x][$y]; ?
- } ?
- } ?
- ?
也可以省略掉中间的那层循环:
for($x=4;$x<=8;$x++){
push@newAoA,[@{$AoA[$x]}[7..12]];
}
其实用map函数可以更加简练:
@newAoA=map{[@{$AoA[$_]}[7..12]]}4..8;
虽然你的经理也许会抱怨这种难以理解的代码可能会带来安全隐患,然而这种观点还是颇有争议的(兴许还可以更加安全也说不定^_^)。
换了是我,我会把它们放进一个函数中实现:
- @newAoA=splice_2D(@AoA,4=>8,7=>12); ?
- subsplice_2D{ ?
- my$lrr=shift;#指向Perl二维数组的引用 ?
- my($x_lo,$x_hi,?
- $y_lo,$y_hi)=@_; ?
- ?
- returnmap{ ?
- [@{$lrr->[$_]}[$y_lo..$y_hi]] ?
- }$x_lo..$x_hi; ?
- } ?