ruby-on-rails – 加载用于在Rails中解析的网页
发布时间:2020-12-17 03:08:33 所属栏目:百科 来源:网络整理
导读:假设,我想从Web到我的应用程序获取一个页面并使用它进行某种解析.我怎么做?我应该从哪里开始?应该是一些插件/宝石吗?解决此类任务的常用做法是什么? 解决方法 你应该尝试像 Hpricot( wiki)或 Nokogiri这样的宝石. Hpricot示例: require 'open-uri'requi
假设,我想从Web到我的应用程序获取一个页面并使用它进行某种解析.我怎么做?我应该从哪里开始?应该是一些插件/宝石吗?解决此类任务的常用做法是什么?
解决方法
你应该尝试像
Hpricot(
wiki)或
Nokogiri这样的宝石.
Hpricot示例: require 'open-uri' require 'rubygems' require 'hpricot' html = Hpricot(open(an_url).read) # This would search for any images inside a paragraph (XPath) html.search('/html/body//p//img') # This would search for any images with the class "test" (CSS selector) html.search('img.test') Nokogiri的例子: require 'open-uri' require 'rubygems' require 'hpricot' html = Nokogiri::HTML(open(an_url).read) # This would search for any images inside a paragraph (XPath) html.xpath('/html/body//p//img') # This would search for any images with the class "test" (CSS selector) html.css('img.test') Nokogiri通常更快.这两个库都具有很多功能. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |