使用request与正则表达式爬取bangumi动画排行榜
发布时间:2020-12-14 06:13:50 所属栏目:百科 来源:网络整理
导读:import jsonimport requestsfrom requests.exceptions import RequestException import re import time def get_one_page(url): try : headers = { ‘User-Agent‘: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML,like Geck
import json
import requests
from requests.exceptions import RequestException import re import time def get_one_page(url): try: headers = { ‘User-Agent‘: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/65.0.3325.162 Safari/537.36‘ } response = requests.get(url,headers=headers) if response.status_code == 200: return response.content.decode(‘utf-8‘) return None except RequestException: return None def parse_one_page(html): pattern = re.compile( ‘<h3>.*?class="l">(.*?)</a>.*?<small>Rank.*?</small>(d+)</span>‘,re.S) items = re.findall(pattern,html) print(items) def main(offset): url = ‘http://bangumi.tv/anime/browser?sort=rank&page=‘ + str(offset) html = get_one_page(url) parse_one_page(html) if __name__ == ‘__main__‘: for i in range(1,20): main(offset=i) time.sleep(1)
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- Cocos2dx 3.0 过渡篇(三十一)ValueVector和Vector不得不说
- Xcode 7自动生成初始化,getter和setter?
- 使用XSLT从嵌套XML转换为扁平化XML结构
- postgresql的pg_ctl
- 如何在C#中将Cobol COMP字段输出转换为可读小数?
- Flex 图片自动播放(亦可手动控制)
- objective-c – 在这个函数声明中“ – (void)”是什么意思
- ruby-on-rails – 当我尝试使用预先签名的URL上传时,AWS Ru
- 安装Oracle 11gR2 64bit时,克隆数据库卡在2%,日志提示“C
- ruby-on-rails – 如何很好地打印我在救援块中捕获的格式化