加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python爬虫之小说网站--下载小说(正则表达式)

发布时间:2020-12-16 23:57:52 所属栏目:Python 来源:网络整理
导读:= txt=requests.get(url).content.decode( ) m1=re.compile(r (.+) m2=re.compile(r raw=m2.findall(txt) sanguo= i 2],url+i[1]]) span style="color: #008000"# span style="color: #008000"print(sanguo) span style="color: #000000" m3 =re.compile(rsp

= txt=requests.get(url).content.decode() m1=re.compile(r(.+) m2=re.compile(r raw=m2.findall(txt) sanguo= i 2],url+i[1]])

<span style="color: #008000">#<span style="color: #008000">print(sanguo)
<span style="color: #000000">
m3=re.compile(r<span style="color: #800000">'<span style="color: #800000">

(.+)

<span style="color: #800000">'
,re.S) <span style="color: #008000">#
<span style="color: #008000">每章节小说内容

m4=re.compile(r<span style="color: #800000">'
<span style="color: #800000">
<span style="color: #800000">'
) <span style="color: #008000">#
<span style="color: #008000">
小说内容中的符号

m5=re.compile(r<span style="color: #800000">'
<span style="color: #800000">&nbsp;&nbsp;&nbsp;&nbsp;
<span style="color: #800000">'
<span style="color: #000000">)
with open(
<span style="color: #800000">'
<span style="color: #800000">中国合伙人1.txt
<span style="color: #800000">'
,<span style="color: #800000">'
<span style="color: #800000">a
<span style="color: #800000">'
<span style="color: #000000">) as f:
<span style="color: #0000ff">for
i <span style="color: #0000ff">in
<span style="color: #000000"> sanguo:
i_url
=i[1] <span style="color: #008000">#
<span style="color: #008000">i[1]为小说章节url

<span style="color: #0000ff">print
(<span style="color: #800000">"
<span style="color: #800000">正在下载----->
<span style="color: #800000">"
,i[0]) <span style="color: #008000">#
<span style="color: #008000">i[0]为小说章节目录

r_nr=requests.get(i_url).content.decode(<span style="color: #800000">'
<span style="color: #800000">gbk
<span style="color: #800000">'
<span style="color: #000000">)
n_nr
=<span style="color: #000000">m3.findall(r_nr)
<span style="color: #008000">#<span style="color: #008000">print(n_nr)
n=m4.sub(<span style="color: #800000">'',n_nr[0]) <span style="color: #008000">#<span style="color: #008000">把n_nr[0]中"
"替换为空
n2=m5.sub(<span style="color: #800000">''<span style="color: #000000">,n)
f.write(<span style="color: #800000">'<span style="color: #800000">n<span style="color: #800000">'+i[0]+<span style="color: #800000">'<span style="color: #800000">n<span style="color: #800000">') <span style="color: #008000">#<span style="color: #008000">把小说的目录写入文件
f.write(n2)

运行效果如下:

保存的内容如下:

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读