perl 爬虫研究2
发布时间:2020-12-16 00:01:59 所属栏目:大数据 来源:网络整理
导读:继续研究云总的代码时,发现很纠结的问题。 再看代码,试着单月测试的方法研究,始终输出的是数组, 感觉不会再爱了。。。。先把上午的活干完,晚上飞机走人了。。 # !/usr/bin/perl use URI:: URL; use Web:: Scraper; use Data:: Dumper; my $base_url = "
继续研究云总的代码时,发现很纠结的问题。 再看代码,试着单月测试的方法研究,始终输出的是数组, 感觉不会再爱了。。。。先把上午的活干完,晚上飞机走人了。。 #!/usr/bin/perl use URI::URL; use Web::Scraper; use Data::Dumper; my $base_url="http://www.cnblogs.com/"; my $host=URI::URL->new($base_url)->host; print "host:$hostn"; $scraper=scraper{ process '//a','links[]'=>'@href';}; print $scraper->scrape( URI->new($base_url))->{'links'}; foreach(@{$res}){ $link=$_->as_string; $link=URI::URL->new($link,$base_url); $link = $link->abs->as_string; if( $link =~ /(.*?)#(.*)/ ) { $link = $1; } print Dumper($link); } (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |