加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

ruby – 使用Mechanize gem根据它们在DOM中的位置返回链接集合

发布时间:2020-12-16 22:49:42 所属栏目:百科 来源:网络整理
导读:我正在努力机械化.我希望“点击”一组链接,这些链接只能通过它们的位置(div#content中的所有链接)或它们的href来识别. 我已经尝试过上述两种识别方法但没有成功. 从文档中,我无法弄清楚如何根据它们在DOM中的位置返回链接集合(用于单击),而不是直接在链接上
我正在努力机械化.我希望“点击”一组链接,这些链接只能通过它们的位置(div#content中的所有链接)或它们的href来识别.

我已经尝试过上述两种识别方法但没有成功.

从文档中,我无法弄清楚如何根据它们在DOM中的位置返回链接集合(用于单击),而不是直接在链接上返回属性.

其次,documentation建议你可以使用:href来匹配部分href,

page = agent.get('http://foo.com/').links_with(:href => "/something")

但我唯一可以让它返回链接的方法是传递一个完全限定的URL,例如

page = agent.get('http://foo.com/').links_with(:href => "http://foo.com/something/a")

如果我想返回带有href的链接集合,这不是很有用

http://foo.com/something/a
http://foo.com/something/b
http://foo.com/something/c
etc...

难道我做错了什么?我有不切实际的期望吗?

解决方法

第二部分
您传递给的值:href默认情况下必须是完全匹配.因此,示例中的href仅匹配< a href =“/ something”>< / a>而不是< a href =“foo.com/something/a”>< / a>

你想要做的是传入一个正则表达式,以便它匹配href字段中的子字符串.像这样:

page = agent.get('http://foo.com/').links_with(:href => %r{/something/})

编辑:
第一部分
要使其仅在链接中选择链接,请在字符串中添加nokogiri样式的搜索方法.像这样:

page = agent.get('http://foo.com/').search("div#content").links_with(:href => %r{/something/})    # **

好吧,这不起作用,因为在你执行page = agent.get(‘http://foo.com/’).search(“div #content”)后,你会得到一个Nokogiri对象而不是机械对象,所以links_with不起作用.但是,您将能够使用css方法从Nokogiri对象中提取链接.我会建议像:

page = agent.get(‘http://foo.com/’).search(“div#content”).css(“a”)

如果这不起作用,我建议查看http://nokogiri.org/tutorials

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读