加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

下载妹子图

发布时间:2020-12-17 17:23:25 所属栏目:Python 来源:网络整理
导读:今天PHP站长网 52php.cn把收集自互联网的代码分享给大家,仅供参考。 #!/usr/bin/env python#coding=utf-8import urllibimport re '''抓取www.meizitu.com的图片'''#http://www.meizitu.com/a/list_1_1.html#获取html内容

以下代码由PHP站长网 52php.cn收集自互联网

现在PHP站长网小编把它分享给大家,仅供参考

#!/usr/bin/env python
#coding=utf-8
import urllib
import re 

'''抓取www.meizitu.com的图片'''
#http://www.meizitu.com/a/list_1_1.html


#获取html内容
def getHtml(url):
    file = urllib.urlopen(url)
    html = file.read()
    return html

#匹配图片地址返回列表数组
def getImg(html):
    reg = r'data-original="(.+?.jpg)"'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    return imglist

#下载图片
def download(imgList,page):
    x = (page-1)*10
    for imgurl in imgList:
        print 'download file '+str(x)+' start'
        urllib.urlretrieve(imgurl,'D:/python/meizitu/%s.jpg' %x)
        print 'download file '+str(x)+' end'
        x+=1

# 获取图片数量,最好是10的倍数
def getPicNum(number=10,page=1):
    pageSize = 10
    pageNumber = number/10
    while(page<=pageNumber):
        url = "http://www.meizitu.com/a/list_1_"+str(page)+".html"
        html = getHtml(url)
        print 'get %s html success' % page 
        imageList = getImg(html)
        print 'get %s imageurl success' %page
        download(imageList,page)
        page=page+1

#从第一页开始获取20张图片,可以自行定义从多少页开始进行获取
getPicNum(number=20,page=1)


raw_input("press enter")

以上内容由PHP站长网【52php.cn】收集整理供大家参考研究

如果以上内容对您有帮助,欢迎收藏、点赞、推荐、分享。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读