如何从Perl中提取URL和链接文本？

发布时间：2020-12-15 21:20:38 所属栏目：大数据来源：网络整理

导读：我以前问过如何在Groovy这样做。然而，现在我正在Perl重写我的应用程序，因为所有的CPAN库。如果页面包含这些链接： a href="http://www.google.com"Google/aa href="http://www.apple.com"Apple/a 输出将是： Google,http://www.google.comApple,http://ww

我以前问过如何在Groovy这样做。然而，现在我正在Perl重写我的应用程序，因为所有的CPAN库。

如果页面包含这些链接：

<a href="http://www.google.com">Google</a>

<a href="http://www.apple.com">Apple</a>

输出将是：

Google,http://www.google.com
Apple,http://www.apple.com

在Perl中最好的方法是什么？

解决方法

请查看使用 WWW::Mechanize模块。它将为您提取您的网页，然后让您轻松地使用URL列表。

my $mech = WWW::Mechanize->new();
$mech->get( $some_url );
my @links = $mech->links();
for my $link ( @links ) {
    printf "%s,%sn",$link->text,$link->url;
}

很简单，如果您想浏览该页面上的其他网址，那就更简单了。

Mech基本上是一个对象中的浏览器。

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!