加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

下载小说到本地

发布时间:2020-12-17 17:23:18 所属栏目:Python 来源:网络整理
导读:今天PHP站长网 52php.cn把收集自互联网的代码分享给大家,仅供参考。 ?import reimport osimport urllib.request# 小说目录home = "http://www.23zw.com/olread/9/9068/"if __name__ == '__main__': url = home + "index.

以下代码由PHP站长网 52php.cn收集自互联网

现在PHP站长网小编把它分享给大家,仅供参考

?
import re
import os
import urllib.request

# 小说目录
home = "http://www.23zw.com/olread/9/9068/"

if __name__ == '__main__':
    url = home + "index.html"
    page = urllib.request.urlopen(url).read()
    page = page.decode("gbk")
    print(len(page))
    
    s_key = 'h1>(.+?)<'
    re_c = re.compile(s_key)
    ls = re.findall(re_c,page)
    if len(ls) > 0:
        title = ls[0]
    print(title)
    if not os.path.exists(title):
        os.makedirs(title)
    urllib.request.urlretrieve(url,title + "/index.html")
    
    s_key = 'href="(.{37}?)"'
    re_c = re.compile(s_key)
    ls = re.findall(re_c,page)
    i = 0
    for l in ls:
        try:
            i += 1
            print("(" + str(i) + "/" + str(len(ls)) + ") " + l)
            if os.path.exists(title + "/" + l):
                continue
            url = home + l
            urllib.request.urlretrieve(url,title + "/" + l)
        except:
            print("error!")
            
    print("finish!")

以上内容由PHP站长网【52php.cn】收集整理供大家参考研究

如果以上内容对您有帮助,欢迎收藏、点赞、推荐、分享。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读