加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

Perl文件读写

发布时间:2020-12-15 23:57:02 所属栏目:大数据 来源:网络整理
导读:在Perl中可以用 open()或者sysopen() 函数来打开文件进行操作,这两个函数都需要通过一个文件句柄(即文件指针)来对文件进行读写定位等操作。 open() 函数: 1:读: open (文件句柄," 文件名")/ open (文件句柄,"文件名"),前提文件必须已经存在,否则会
在Perl中可以用open()或者sysopen()函数来打开文件进行操作,这两个函数都需要通过一个文件句柄(即文件指针)来对文件进行读写定位等操作。
open()函数:
1:读:open(文件句柄,"<文件名")/open(文件句柄,"文件名"),前提文件必须已经存在,否则会返回0,出错信息在$!中。
2:写:open(文件句柄,">文件名"),文件如果不存在,那么创建之,如果存在,内容被清空,长度截为0,$!中有出错信息。
3:追加:open(文件句柄,">>文件名"),基本同写,但有一点,文件中的内容不会被清空,新的内容会追加到原文后面。
4:读写:open(文件句柄,"+<文件名"),通过“+<”模式,你可以既可以读文件,又可以写文件。你可以通过tell()?函数在文件内部移动,通过seek()函数进行定位。如果文件不存在,就会被创建。如果文件已经存在,原来的数据不会被清除。
??????open(文件句柄,"+>文件名"),通过“+>”模式,可以同时读写文件,但与上面不同的是,它是破怀性写,会清除原来的内容。
例子:
open(FD,"<info.txt")||die("Can not open the file!$!n");
@line=<FD>;
close(FD);
上面的例子是打开info.txt这个文件并把文件内容读入@line中,关闭文件。
例子:
open(IN,"<G:/$filename")?or die "Couldn't open $filename for reading: $!";?;
while($line=<IN>){
????????print $line;
}
函数 sysopen() 带有四个参数,第一个是同open()函数类似的文件句柄参数,第二个参数是不带模式信息的文件名,第三个参数是模式参数,由Fcntl 模块提供的逻辑OR运算组合起来的常数构成,第四个参数(可选),为八进制属性值(0666表示数据文件, 0777表示程序)。如果文件可以被打开,sysopen() 返回true,如果打开失败,则返回false。?

不同于open()函数,sysopen()不提供模式说明的简写方式,而是把一些常数组合起来,而且,每个模式常数有唯一的含义,只有通过逻辑OR运算才能将它们组合起来,你可以设置多个行为的组合。?
O_RDONLYRead-only?

O_WRONLY Write-only?

O_RDWR Reading and writing?
O_APPEND Writes go to the end of the file?
O_TRUNC Truncate the file if it existed?
O_CREAT Create the file if it didn't exist?
O_EXCLError if the file already existed (used with O_CREAT)?
当你需要小心行事的时候,就使用sysopen() 函数,例如,如果你打算添加内容到文件中,如果文件不存在,不创建新文件,你可以这样写:?
sysopen(LOG,"/var/log/myprog.log",O_APPEND,0666)?
or die "Can't open /var/log/myprog.log for appending: $!";?
读入单个记录?
有一个容易的方法读入filehandles:用 <FH> 操作符。在标量内容下,它返回文件中的下一个记录,或者返回未定义出错信息。我们可以使用它来把一行读入到一个变量中:?
$line = <FH>;?
die "Unexpected end-of-file" unless defined $line;?
在循环语句中,我们可以这样写:?
while (defined ($record = <FH>)) { # long-winded?
# $record is set to each record in the file,one at a time?
}?
因为要大量进行这样的工作,通常再进行一下简化,?
把记录放到$_ 中,而不是$record中:?
while (<FH>) {?
# $_ 每次为文件中的一个记录?
在Perl 5.004_04中,我们可以这样做:?
while ($record = <FH>) {?
# $record 每次为文件中的一个记录?
defined() 将自动加上,在Perl 5.004_04以前的版本中,该命令给出一个警示。要了解所用的Perl版本,可在命令行下打入:?
perl -v?
一旦我们读出了一个记录,通常打算去掉记录分隔符,(缺省值为换行符字符):?
chomp($record);?
Perl 4.0版本仅有chop()操作,去掉串的最后一个字符,不管该字符是什么。chomp() 没有这么大的破坏性,如果有行分隔符存在,它仅去掉行分隔符。如果你打算去掉行分隔符,就用chomp() 来代替chop()。?
读入多个记录?
如果你调用<FH>,返回文件中剩余的记录。如果你处于文件尾,则返回空表:?
@records = <FH>;?
if (@records) {?
print "There were ",scalar(@records)," records read.n";?
在下面的一步中,进行赋值和测试两项工作:?
if (@records = <FH>) {?
print "There were "," records read.n";?
}?
chomp() 也可适用对数组操作:?
chomp(@records);?
对于任何表达式,都可以进行chomp操作,故你可以在下面的一步中这样写:?
chomp(@records = <FH>);?
什么是记录??
记录的缺省定义为:“行”。?
记录的定义由$/ 变量控制的,该变量存放所输入的记录的分隔符,因为换行符字符(根据定义!)是用来分隔行的,故其缺省值为串“n”。?
例如,你可以用任何你想要替换的符号来代替“n”。?
$/ = ";";?
$record = <FH>; # 读入下一个用分号分隔的记录?
$/可以取其它两个有趣的值:空串("") 和undef。读入段落?
$/ =""的写法是用来指示Perl读入段落的,段落是由两个或两个以上的换行符构成的文本块。这不同于设置为"nn",后者仅读入由两行组成的文本块。在这种情况下,将出现这样一个问题:如果有连续的空行存在,例如“textnnnn”,你既可以把它解释为一个段落 ("text"),也可以解释为两个段落 ("text",后面跟两个换行符,以及一个空段落,后面跟两个空行。)?
在读入文本时,第二个解释用途不大。如果你正在读的段落出现上述情况,你不必过滤出“空”段落。?
$/ = "nn";?
chomp;?
next unless length; # 跳过空段?
# ...?
你可以把 $/设置为undef,它用于读入后面跟着两个或多个换行符组成的段落: undef $/;?
读入整个文件?
$/ 的其它有趣的值为undef。如果设置为该值,就将告诉Perl,读命令将把文件的剩余部分作为一个串返回:?
undef $/;?
$file = <FH>;因为改变了 $/的值,将会影响以后的每次读操作,而不仅是下一个读操作。通常,你需要将该操作限制在局部。通过下面的例子,可以把文件句柄的内容读入到一个串中:?
{?
local $/ = undef;?
$file = <FH>;?
}
记住:Perl变量可读入很长的串。尽管你的文件大小不可以超出你的虚拟内存容量的限度,你仍可以读入尽可能多的数据。?
用正则表达式对文件进行操作?
一旦你有个包含了整个串的变量,你可以使用正则表达式,对整个文件进行操作,而不是对文件中的某个块进行操作。有两个有用的正则表达式标记/s和/m。一般,Perl的正则表达式对行进行处理,你可以这样写:?
undef $/;?
if ($line =~ /(b.*grass)$/) {?
print "found $1n";?
如果把我们的文件填入如下内容:?
browngrass?
bluegrass?
则输出为:?
found bluegrass?
它没有找到“browngrass”,这是因为$ 仅在串尾寻找其匹配, (或者在串结束前的一行)。如果在包含很多行的串中,用"^" 和"$" 来匹配,,我们可以使用 /m ("multiline") 选项:?
if ($line =~ /(b.*grass)$/m) {}?
现在程序会把如下的信息输出:?
found browngrass?
类似地,句点可以匹配除了换行符之外的所有字符:?
if (/19(.*)$/) {?
if ($1 < 20) {?
$year = 2000+$1;?
} else {?
$year = 1900+$1;?
}?
如果我们从文件中读入“1981”,$_ 将包含“1981n”。正则表达式中的句点匹配“8”和“1”,而不匹配“n”。这里正需要这样做,因为换行符不是日期的组成部分。?
对于一个包含很多行的串,我们也许要提取其中的大的块,这些块可能会跨越行分隔符。在这种情况下,我们可以使用 /s 选项,并用句点来匹配除了换行符以外的所有字符。?
if (m{<B>(.*?)</B>}s) {?
print "Found bold text: $1n";?
此处,我用了{}来表示正则表达式的起始和结束,而不用斜杠,所以,我就可以告诉 Perl我正在匹配,起始字符为"m",结束字符为"s"。你可以把/s 和/m 选项组合使用:?
if (m{^<FONT COLOR="red">(.*?)</FONT>}sm) {?
# ...?
总结? 有两种方法打开文件:open()函数的特点是快速简捷,而sysopen()函数功能强大而复杂。通过 <FH> 操作符,可以读入一个记录,$/ 变量可以让你控制记录是什么。如果你打算把很多行的内容读入到一个串中,不要使用忘记/s和/m 这两个正则表达式标记。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读