加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

如何从Perl中提取URL和链接文本?

发布时间:2020-12-15 21:20:38 所属栏目:大数据 来源:网络整理
导读:我以前问过如何在Groovy这样做。然而,现在我正在Perl重写我的应用程序,因为所有的CPAN库。 如果页面包含这些链接: a href="http://www.google.com"Google/aa href="http://www.apple.com"Apple/a 输出将是: Google,http://www.google.comApple,http://ww
我以前问过如何在Groovy这样做。然而,现在我正在Perl重写我的应用程序,因为所有的CPAN库。

如果页面包含这些链接:

<a href="http://www.google.com">Google</a>

<a href="http://www.apple.com">Apple</a>

输出将是:

Google,http://www.google.com
Apple,http://www.apple.com

在Perl中最好的方法是什么?

解决方法

请查看使用 WWW::Mechanize模块。它将为您提取您的网页,然后让您轻松地使用URL列表。
my $mech = WWW::Mechanize->new();
$mech->get( $some_url );
my @links = $mech->links();
for my $link ( @links ) {
    printf "%s,%sn",$link->text,$link->url;
}

很简单,如果您想浏览该页面上的其他网址,那就更简单了。

Mech基本上是一个对象中的浏览器。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读