加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

使用request与正则表达式爬取bangumi动画排行榜

发布时间:2020-12-14 06:13:50 所属栏目:百科 来源:网络整理
导读:import jsonimport requestsfrom requests.exceptions import RequestException import re import time def get_one_page(url): try : headers = { ‘User-Agent‘: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML,like Geck
import json
import requests
from requests.exceptions import RequestException import re import time def get_one_page(url): try: headers = { ‘User-Agent‘: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/65.0.3325.162 Safari/537.36‘ } response = requests.get(url,headers=headers) if response.status_code == 200: return response.content.decode(‘utf-8‘) return None except RequestException: return None def parse_one_page(html): pattern = re.compile( ‘<h3>.*?class="l">(.*?)</a>.*?<small>Rank.*?</small>(d+)</span>‘,re.S) items = re.findall(pattern,html) print(items) def main(offset): url = ‘http://bangumi.tv/anime/browser?sort=rank&page=‘ + str(offset) html = get_one_page(url) parse_one_page(html) if __name__ == ‘__main__‘: for i in range(1,20): main(offset=i) time.sleep(1)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读