利用Python爬取杭州租房信息,发现月薪没有8K还是不要租房了吧
前言
小编的一个好朋友跑去杭州工作了,跟我吐槽杭州的租房太贵了,房租正在成为摧垮年轻人的“第一根稻草”,在杭州打拼的你,所在的城区房租涨了吗?你是否还能潇洒地说出 “买不起房子,就租嘛”?
小编于是就爬取了杭州的租房信息并进行了简单的数据分析,唉,买不起房子,感觉也快租不起房子了。
基本环境配置
版本:Python3.6
复制代码
系统:Windows
爬虫部分:
import re
import time
import requests
from lxml import etree
复制代码
数据可视化部分:
import pandas as pd
from pyecharts import Bar, Line, Overlap
复制代码
爬虫主要思路:
- 各个区域的租房信息总页数为 "..." ,所以无法直接获取,便通过下一页的链接,不断的判断,最后获取总页数
- 正常来说一页网页里是有30个房源的,但是最后一页一般是没到30个房源,所以需要判断最后一页有多少房源
- 租房信息的标题会有英文符的逗号,会导致后期txt文件转存为csv文件,出现错误,于是直接在信息获取的时候直接替换
- 对房间类型(几室几厅)的获取,本来以为里面都是数字,但是出现了 "多室多厅" 这种的,所以也予以判断删除,因为后面需要对单间价格进行计算,会出现错误
爬虫部分代码
数据分析部分代码
月薪没8K以上真的不好租房,太贵了,还是和别人合租划得来
转载于:https://juejin.im/post/5c013561e51d453c3a0e8ca0
利用Python爬取杭州租房信息,发现月薪没有8K还是不要租房了吧相关推荐
- 利用python爬取飞猪信息_Python---20行代码爬取斗鱼平台房间数据(下)-阿里云开发者社区...
在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...
- 利用python爬取股票实时信息
注:本次实验使用python3.7以及pycharm完成 网络爬虫 所为爬虫就是建立一个与某个网站的连接 通过该连接获取输入流,读取网站内容.实质上就是一个socket的输入输出操作,根据http状态 ...
- python爬取boss直聘招聘信息_年底啦,利用Python爬取Boss直聘的招聘信息,为明年跳槽做准备...
原标题:年底啦,利用Python爬取Boss直聘的招聘信息,为明年跳槽做准备 前言 为什么都说程序员的薪资高,但是刚开始入职的你,薪资并不是自己想象中的那样,首先是你的工作经验不足,其次就是需要不断的 ...
- 利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息
新增:国外疫情网站介绍 已更新:爬取国外疫情数据 已更新:新型肺炎历史数据下载 2020年3月27日补充: 制作了一个全球肺炎数据查询下载网站,效果如下: 访问地址:http://119.3.227. ...
- python爬取电脑本地数据_利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息...
原标题:利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息 新型肺炎肆虐全国,可以预知,最近一两年地理学中会有一部分论文研究新型肺炎的空间分布及与其他指标的关联分析.获取其患病人 ...
- python爬取自如房间信息(一)
使用python和selenium+Chrome Headless爬取自如房间信息,并将结果存储在MongoDB中.其中最麻烦的应该是每间房的价格,因为自如是用一张图片和offset来显示价格,所以不 ...
- python 怎么爬桌软件数据_如何利用Python爬取并分析红岭创投的数据?
第一步:爬取数据 通过 selenium + Firefox 的无头模式将需要的数据爬取出来,代码实现不在赘述,详细步骤可查看我的上一篇图文(如何利用Python爬取网易新闻), 由于 seleniu ...
- python 翻译库本地库_利用python爬取并翻译GEO数据库
原标题:利用python爬取并翻译GEO数据库 GEO数据库是NCBI创建并维护的基因表达数据库,始于2000年,收录了世界各国研究机构提交的高通量基因表达数据,现芯片集数据量高达12万以上.想要从这 ...
- 利用python爬取东方财富网股吧评论并进行情感分析(一)
利用python爬取东方财富网股吧评论(一) python-东方财富网贴吧文本数据爬取 分享一下写论文时爬数据用到的代码,有什么问题或者改善的建议的话小伙伴们一起评论区讨论.涉及内容在前人的研究基础之 ...
最新文章
- Unity加载配置文件的两种方式
- Ubuntu下安装Python开发的Facebook Faiss相似性搜索工具
- Gluon.vision的几类数据集
- 【数据结构】顺序线性表的构造和存储数据
- 我的世界源代码python_用Python写的游戏《我的世界》 还原初代世界
- HDU_2795 Billboard(线段树)
- vue 实例数据绑定 指令 事件
- 空间滤波_第三章 灰度变换与空间滤波-(六)锐化空间滤波器之非锐化掩蔽
- mongoDB - 插入数据
- android+解锁工具,安卓手机解锁助手 (A Unlock Tool)
- 小飞鱼二开 使用jwt TOKEN方式单点登录开发(代码)
- 2.try、catch、finally执行顺序 以及final、finally和finalize的区别
- 【华为机试真题 Python实现】数大雁【2022 Q2 | 100分】
- 3.计算机网络——加密,数字签名,数字证书
- 蓝牙BR/EDR和Bluetooth Smart的十大重要区别
- word文档中引用参考文献
- 有一种心酸,叫靠自己
- python语法(一)
- 关于海康HCNetSDK.dll[7]
- ASP.net创建Controller视图时报错(Exception has been thrown by the target of an Invocation.)