如何从Perl中提取URL和链接文本?
发布时间:2020-12-15 21:20:38 所属栏目:大数据 来源:网络整理
导读:我以前问过如何在Groovy这样做。然而,现在我正在Perl重写我的应用程序,因为所有的CPAN库。 如果页面包含这些链接: a href="http://www.google.com"Google/aa href="http://www.apple.com"Apple/a 输出将是: Google,http://www.google.comApple,http://ww
我以前问过如何在Groovy这样做。然而,现在我正在Perl重写我的应用程序,因为所有的CPAN库。
如果页面包含这些链接: <a href="http://www.google.com">Google</a> <a href="http://www.apple.com">Apple</a> 输出将是: Google,http://www.google.com Apple,http://www.apple.com 在Perl中最好的方法是什么? 解决方法
请查看使用
WWW::Mechanize模块。它将为您提取您的网页,然后让您轻松地使用URL列表。
my $mech = WWW::Mechanize->new(); $mech->get( $some_url ); my @links = $mech->links(); for my $link ( @links ) { printf "%s,%sn",$link->text,$link->url; } 很简单,如果您想浏览该页面上的其他网址,那就更简单了。 Mech基本上是一个对象中的浏览器。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |