爬虫部分

// An highlighted block
def main():base_url1 = 'https://hz.58.com/xinfang/loupan/all/p'base_url2 = '/?PGTID=0d0091a8-0004-f055-d9b7-c447c3e1c187&ClickID=1'date_list = []for i in range(1,34):html = ask_url(base_url1+str(i)+base_url2)bs = BeautifulSoup(html, 'html.parser')list = bs.find_all(class_='item-mod')for item in list[2:]:  # 前两个item-mod 存储的不是具体房产信息bs_mod = BeautifulSoup(str(item), 'html.parser')it1 = bs_mod.find_all(class_='items-name')[0]try:it2 = bs_mod.find_all(class_='price')[0]except:it2 = bs_mod.find_all(class_='price-txt')[0]date_list.append([it1.get_text(), it2.get_text(), transfrom(it1.get_text())])print('第%d页完成' %i)print('一共%d条' %len(date_list))save_Date(date_list,'杭州新房价格坐标.xls')

因为这里爬取的是新楼的房价,很多的地方都是在建中,很多都还没有定价,所以部分价格在源代码中的标签使用的是’price-txt’而不是’price’。

代用高德api接口实现地址的获取

def transfrom(addr):parameters = { 'keywords' : addr,'key' : '**********************'}base =     'https://restapi.amap.com/v3/place/text?parameters'try:response = requests.get(base , parameters , timeout = 2)res = json.loads(response.text)return res['pois'][0]['location']except:return '地址获取失败'

这里需要去高德的开放平台进行获取你的key简单的进行注册你的账号。这里在完成的时候,对于返回值的处理我搞了很久没搞好,后来才发现他的网页中本身可以进行返回值的查看,我使用的是对关键字搜索。

最后进行数据的上传就可以获得最终的成果图。

这个是以价格为参考圆圈越大价格越高,本来是想用颜色进行标识,但是效果实在太理想,系统默认的将大部分价格划分的颜色过分接近,没有办法让人直观的进行一眼辨识,最终选择大小来呈现价格的不同。

爬虫 58同城房价信息 高德的接口进行房价地图绘制相关推荐

  1. (64)-- 爬取58同城网页信息

    # 爬取58同城租房信息 from lxml import etree import requestsbase_url = 'http://bj.58.com/chuzu/?utm_source=ma ...

  2. 多线程爬取58同城二手车信息

    多线程爬取58同城二手车信息 目录 多线程的介绍 数据的爬取 数据的解析 多线程 简介:线程是轻量级的进程,是程序执行流的最小单元,它不拥有系统的资源,运行占用独立的资源且资源小,且多个线程共享一个单 ...

  3. python爬取58同城租房信息_分页爬取58同城租房信息.py

    import requests,re,openpyxl,os headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleW ...

  4. 58上租房显示服务器异常,“58同城租房信息”满是套路,你中招了吗?

    原标题:"58同城租房信息"满是套路,你中招了吗? 58同城,大家都很熟悉.尤其是那句广告词:58同城,一个神奇的网站.网站的确是挺神奇的,招工信息.租房信息各种信息无奇不有,然而 ...

  5. 字体加密-58同城简历信息爬取

    加密文件通过base64加密,先拿到加密字符串,通过base64解密,保存成woff文件 利用fonttool把woff文件保存成xml文件,再开始分析真实数据与加密数据的动态映射关系 映射关系如下: ...

  6. python爬虫58同城(多个信息一次爬取)

    对58同城二手平板电脑的爬虫 一.先爬取内容中的一项 先爬取一项的代码 爬去一项的结果 二.爬取一整页 一整页代码 一整页的全部信息结果 有网友留言说,这个代码已经不能爬取了,我2018.11.9号查 ...

  7. python爬虫爬取58同城租房信息(使用动态IP)输出Excel文件

    python爬虫爬取58同城信息(使用动态IP) 新手,为了做一个数据分析,搞了几天,终于搞出来了,大家可以给点意见啊. # coding=utf-8 import sys import csv im ...

  8. python爬取58同城租房信息,用selenium爬取58同城租房信息(万级数据)

    今天想做一个58同城的爬虫,然后到页面分析一下链接,发现58同城的链接的有些参数是由js动态生成的,然后我就想偷懒了.(当然其实去js文件中找到生成式并不难),但我就是不想去找.然后就想到了selen ...

  9. python爬虫58同城租房

    使用scrapy框架爬取58上面租房信息 源码如下: -- coding: utf-8 -- import scrapy from zufang.items import ZufangItem cla ...

最新文章

  1. 用户进程与内核进程是一一对应的吗_用户线程、内核线程和轻量级进程
  2. 关于ensp配置出现 Error: Please renew the default configurations.
  3. Windows server 2016 搭建RDS服务
  4. element-ui表单_每日UI挑战强加-登录表单(分步教程)
  5. C#中拷贝指定文件夹下的所有文件夹目录到指定文件夹中的方法
  6. 7-7 旅游规划 (8 分)
  7. 提供做某事Do you want me to..._45
  8. Easyui在form表单提交的时候,如果有datebox报 Uncaught SyntaxError: Unexpected token 的解决...
  9. mysql5.5编译安装_mysql5.5编译安装及配置
  10. 解决方案:Android开发基于rtmp视频直播
  11. 原生js获取html根元素,JS获取屏幕高度的简单实现代码
  12. 简单理解有监督学习、无监督学习、强化学习
  13. c语言文件操作可重入,C语言试题
  14. HBase之一月速成:整合phoenix
  15. FPGA开发板学习(1)
  16. openlayers 绘制动态迁徙线、曲线
  17. 德累斯顿工业大学计算机学院,德累斯顿工业大学
  18. 2023年跨年代码(新年祝福语生成器)
  19. python实现任意url转存为图片
  20. Windows 11 必装软件

热门文章

  1. 什么是fine-tuning?
  2. c++ string类深拷贝其他版本(简洁版,引用计数版,写时拷贝版)
  3. 强化学习中Sparse Reward问题该怎么解决?
  4. CBA联赛终于迎来主客场,宁波町渥迎战夺冠热门辽宁本钢
  5. Xftp:No matching outgoing encryption algorithm found问题
  6. Matlab平台下Nvidia显卡和Intel I7 CPU的并行计算性能比较:第一次测试
  7. 陈奕迅--《呼叫转移》试听下载 (《爱情呼叫转移》主题曲)
  8. 花旗整合全球财富管理业务
  9. Android 根据手机的屏幕的大小设置图片的等比例缩放
  10. jQuery三种删除节点的方法