加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

ruby – 使用Mechanize和Nokogiri保存图像?

发布时间:2020-12-17 04:31:32 所属栏目:百科 来源:网络整理
导读:我正在使用Mechanize和Nokogiri来收集一些数据.我需要保存每个请求随机生成的图片. 在我的尝试中,我被迫下载所有图片,但我唯一想要的是位于div#specific中的图像. 此外,是否可以从中生成Base64数据,而无需保存或重新加载其来源? require 'rubygems'require
我正在使用Mechanize和Nokogiri来收集一些数据.我需要保存每个请求随机生成的图片.

在我的尝试中,我被迫下载所有图片,但我唯一想要的是位于div#specific中的图像.

此外,是否可以从中生成Base64数据,而无需保存或重新加载其来源?

require 'rubygems'
require 'mechanize'
require 'nokogiri'

a = Mechanize.new { |agent|
    agent.keep_alive = true
    agent.max_history = 0
}

urls = Array.new()
urls.push('http://www.domain.com');

urls.each {|url|

    page = a.get(url)
    doc = Nokogiri::HTML(page.body)

    if doc.at_css('#specific')

        page.images.each do |img|
          img.fetch.save('picture.png')
        end

    end
}

解决方法

要从特定位置获取图像:
agent = Mechanize.new
page = agent.get('http://www.domain.com')
images = page.search("#specific img")

要保存图像:

agent.get(images.first.attributes["src"]).save "path/to/folder/image_name.jpg"

要保存图像而不保存:

encoded_image = Base64.encode64 agent.get(images.first.attributes["src"]).body_io.string

我运行这个只是为了确保编码的图像可以被解码回来:

File.open("images/image_name.jpg","wb") {|f| f.write(Base64.decode64(encoded_image))}

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读