加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python爬虫爬取淘宝商品信息

发布时间:2020-12-16 21:12:13 所属栏目:Python 来源:网络整理
导读:本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下 import requests as req import re def getHTMLText(url): try: r = req.get(url,timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except:

本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url,timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt,html): 
 try: 
 plt = re.findall(r'"view_price":"[d.]*"',html) 
 tlt = re.findall(r'"raw_title":".*?"',html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price,title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}t{:8}t{:16}" 
 print(tplt.format("序列号","价格","商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count,j[0],j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList,html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main() 

效果图:

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持编程小技巧。

您可能感兴趣的文章:

  • Python爬虫信息输入及页面的切换方法
  • 一个简单的python爬虫程序 爬取豆瓣热度Top100以内的电影信息
  • python爬虫爬取淘宝商品信息(selenum+phontomjs)
  • Python实现可获取网易页面所有文本信息的网易网络爬虫功能示例
  • 使用python爬虫实现网络股票信息爬取的demo
  • python爬虫_微信公众号推送信息爬取的实例
  • Python网络爬虫与信息提取(实例讲解)
  • Python爬虫实现网页信息抓取功能示例【URL与正则模块】
  • Python爬虫框架Scrapy实战之批量抓取招聘信息
  • python定向爬虫校园论坛帖子信息

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读