ruby – 使用Mechanize gem根据它们在DOM中的位置返回链接集合
我正在努力机械化.我希望“点击”一组链接,这些链接只能通过它们的位置(div#content中的所有链接)或它们的href来识别.
我已经尝试过上述两种识别方法但没有成功. 从文档中,我无法弄清楚如何根据它们在DOM中的位置返回链接集合(用于单击),而不是直接在链接上返回属性. 其次,documentation建议你可以使用:href来匹配部分href, page = agent.get('http://foo.com/').links_with(:href => "/something") 但我唯一可以让它返回链接的方法是传递一个完全限定的URL,例如 page = agent.get('http://foo.com/').links_with(:href => "http://foo.com/something/a") 如果我想返回带有href的链接集合,这不是很有用 http://foo.com/something/a http://foo.com/something/b http://foo.com/something/c etc... 难道我做错了什么?我有不切实际的期望吗? 解决方法
第二部分
您传递给的值:href默认情况下必须是完全匹配.因此,示例中的href仅匹配< a href =“/ something”>< / a>而不是< a href =“foo.com/something/a”>< / a> 你想要做的是传入一个正则表达式,以便它匹配href字段中的子字符串.像这样: page = agent.get('http://foo.com/').links_with(:href => %r{/something/}) 编辑: page = agent.get('http://foo.com/').search("div#content").links_with(:href => %r{/something/}) # ** 好吧,这不起作用,因为在你执行page = agent.get(‘http://foo.com/’).search(“div #content”)后,你会得到一个Nokogiri对象而不是机械对象,所以links_with不起作用.但是,您将能够使用css方法从Nokogiri对象中提取链接.我会建议像: page = agent.get(‘http://foo.com/’).search(“div#content”).css(“a”) 如果这不起作用,我建议查看http://nokogiri.org/tutorials (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |