python爬虫爬取淘宝商品信息

发布时间：2020-12-16 21:12:13 所属栏目：Python 来源：网络整理

导读：本文实例为大家分享了python爬取淘宝商品的具体代码，供大家参考，具体内容如下 import requests as req import re def getHTMLText(url): try: r = req.get(url,timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except:

本文实例为大家分享了python爬取淘宝商品的具体代码，供大家参考，具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url,timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt,html): 
 try: 
 plt = re.findall(r'"view_price":"[d.]*"',html) 
 tlt = re.findall(r'"raw_title":".*?"',html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price,title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}t{:8}t{:16}" 
 print(tplt.format("序列号","价格","商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count,j[0],j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList,html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main()

效果图：

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持编程小技巧。

您可能感兴趣的文章:

Python爬虫信息输入及页面的切换方法
一个简单的python爬虫程序爬取豆瓣热度Top100以内的电影信息
python爬虫爬取淘宝商品信息（selenum+phontomjs）
Python实现可获取网易页面所有文本信息的网易网络爬虫功能示例
使用python爬虫实现网络股票信息爬取的demo
python爬虫_微信公众号推送信息爬取的实例
Python网络爬虫与信息提取(实例讲解)
Python爬虫实现网页信息抓取功能示例【URL与正则模块】
Python爬虫框架Scrapy实战之批量抓取招聘信息
python定向爬虫校园论坛帖子信息

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!