requests库
requests库虽然Python的标准库中 urllib模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests宣传是 “HTTP for Humans”,说明使用更简洁方便。 安装和文档地址:利用 pip install requests 中文文档:http://docs.python-requests.org/zh_CN/latest/index.html 发送GET请求:
发送POST请求:
使用代理:使用 import requests url = "http://httpbin.org/get" headers = { ‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,} proxy = { ‘http‘: ‘171.14.209.180:27829‘ } resp = requests.get(url,proxies=proxy) with open(‘xx.html‘,‘w‘,encoding=‘utf-8‘) as fp: fp.write(resp.text)
cookie:如果在一个响应中包含了 import requests url = "http://www.renren.com/PLogin.do" data = {"email":"[email?protected]",‘password‘:"pythonspider"} resp = requests.get(‘http://www.baidu.com/‘) print(resp.cookies) print(resp.cookies.get_dict())
session:之前使用 import requests url = "http://www.renren.com/PLogin.do" data = {"email":"[email?protected]",‘password‘:"pythonspider"} headers = { ‘User-Agent‘: "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/62.0.3202.94 Safari/537.36" } # 登录 session = requests.session() session.post(url,data=data,headers=headers) # 访问大鹏个人中心 resp = session.get(‘http://www.renren.com/880151247/profile‘) print(resp.text)
处理不信任的SSL证书:对于那些已经被信任的SSL整数的网站,比如 resp = requests.get(‘http://www.12306.cn/mormhweb/‘,verify=False) print(resp.content.decode(‘utf-8‘))
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |