Python爬取房产数据，在地图上展现！

发布时间：2020-12-17 00:30:05 所属栏目：Python 来源：网络整理

导读：小伙伴，我又来了，这次我们写的是用python爬虫爬取乌鲁木齐的房产数据并展示在地图上，地图工具我用的是 BDP个人版-免费在线数据分析软件，数据可视化软件，这个可以导入csv或者excel数据。首先还是分析思路，爬取网站数据，获取小区名称，地址，价格，经

小伙伴，我又来了，这次我们写的是用python爬虫爬取乌鲁木齐的房产数据并展示在地图上，地图工具我用的是 BDP个人版-免费在线数据分析软件，数据可视化软件，这个可以导入csv或者excel数据。

首先还是分析思路，爬取网站数据，获取小区名称，地址，价格，经纬度，保存在excel里。再把excel数据上传到BDP网站，生成地图报表

本次我使用的是scrapy框架，可能有点大材小用了，主要是刚学完用这个练练手，再写代码前我还是建议大家先分析网站，分析好数据，再去动手写代码，因为好的分析可以事半功倍，乌鲁木齐楼盘,2017乌鲁木齐新楼盘,乌鲁木齐楼盘信息 - 乌鲁木齐吉屋网这个网站的数据比较全，每一页获取房产的LIST信息，并且翻页，点进去是详情页，获取房产的详细信息(包含名称，地址，房价，经纬度)，再用pipelines保存item到excel里，最后在bdp生成地图报表，废话不多说上代码：

JiwuspiderSpider.py

# -*- coding: utf-8 -*-
from scrapy import Spider,Request
import re
from jiwu.items import JiwuItem
class JiwuspiderSpider(Spider):
 name = "jiwuspider"
 allowed_domains = ["wlmq.jiwu.com"]
 start_urls = ['http://wlmq.jiwu.com/loupan']
 def parse(self,response):
 """
 解析每一页房屋的list
 :param response: 
 :return: 
 """
 for url in response.xpath('//a[@class="index_scale"]/@href').extract():
 yield Request(url,self.parse_html) # 取list集合中的url 调用详情解析方法
 # 如果下一页属性还存在，则把下一页的url获取出来
 nextpage = response.xpath('//a[@class="tg-rownum-next index-icon"]/@href').extract_first()
 #判断是否为空
 if nextpage:
 yield Request(nextpage,self.parse) #回调自己继续解析
 def parse_html(self,response):
 """
 解析每一个房产信息的详情页面，生成item
 :param response: 
 :return: 
 """
 pattern = re.compile('
            
            	相关内容

python getpass模块用法及实例详解
居然有做智能化门禁系统的毕业设计！这波设计可谓是非常有意
Python爬取APP下载链接的实现方法
使用python subprocess.popen ..不能阻止exe停止工作提示[复
Python中使用第三方库xlrd来读取Excel示例
用实例详解Python中的Django框架中prefetch_related()函数对
如何在Python中读取cx_Oracle.LOB数据？
python-过滤熊猫数据框以获取最大日期和符号
python – 在Cython中传递有界方法作为参数
python – Subprocess.popen()不能在Windows上的参数中使用

            
        
    
    
    	
        推荐文章
            
        
    	
        站长推荐
            Python信息抽取之乱码解决办法
python用模块zlib压缩与解压字符串和文件的方法
关于抛出异常和捕获异常
python – 编辑：命名空间和异常处理
urllib库
python清除字符串里非字母字符的方法
python机器学习理论与实战（六）支持向量机
python – SQLAlchemy线程中的事务是否安全？
利用Python破解验证码实例详解
python – 包含数组条目的列的pandas查询
        
        
        
    	
        热点阅读
            
        
        
        
	



【免责声明】本站内容转载自互联网，其发布内容言论不代表本站观点，如果其链接、内容的侵犯您的权益，烦请提交相关链接至邮箱bqsm@foxmail.com我们将及时予以处理。
建议您使用1920×1080分辨率、谷歌浏览器Google Chrome、Microsoft Edge以获得本站的最佳浏览效果
Copygight © 2008-2022 https://www.lidatong.com.cn/ All Rights Reserved. 李大同