租房信息已经有了,为了能对北京目前的租房市场有个直观认识,我对数据进行深度分析,并进行可视化展示

从分析结果中,我得到了哪些位置房源多、各区租房平均价格以及心仪价格地理位置分布等重要信息,为帮助我租房提供重要依据

下面带大家一起看一下整个分析过程:

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:1156465813

1.分析各行政区房源数量及单价

import pandas as pd
beijing_daname=['朝阳区', '丰台区', '海淀区', '大兴区', '通州区', '昌平区', '东城区', '西城区', '顺义区']
data=pd.read_csv('租房数据加经纬度.csv',encoding='gbk')
areas=list(set(list(data['行政区'])))
area_sums={}
for area in areas:area_sums[area]=list(data['行政区']).count(area)
from pyecharts import options as opts
from pyecharts.charts import Bar
import random
hotel_num=[area_sums[i] for i in beijing_daname]
bar = (Bar().add_xaxis(beijing_daname).add_yaxis("", hotel_num).set_global_opts(title_opts=opts.TitleOpts(title="北京各区房源数量")).set_series_opts(label_opts=opts.LabelOpts(is_show=True),markline_opts=opts.MarkLineOpts(data=[opts.MarkLineItem(type_="min", name="最小值"),opts.MarkLineItem(type_="max", name="最大值"),opts.MarkLineItem(type_="average", name="平均值"),]),)
)
bar.render_notebook()

从上图可以得出以下结论:

朝阳区的房源数量最多,有1877套顺义区的房源数量最少,有272套9个区平均房源数量为611套。

各城区房源单价情况(每平米单价*30平米为例)

unit_price={}
for i in list(data.groupby('行政区')):if i[0] in beijing_daname:unit_price[i[0]]=int(i[1]['价格'].sum()/i[1]['面积'].sum())*30
unit_price
bar = (Bar().add_xaxis(list(unit_price.keys())).add_yaxis("", [unit_price[i] for i in list(unit_price.keys())]).set_global_opts(title_opts=opts.TitleOpts(title="北京各区租房均价(每平米单价*30平米为例)")).set_series_opts(label_opts=opts.LabelOpts(is_show=True),markline_opts=opts.MarkLineOpts(data=[opts.MarkLineItem(type_="min", name="最小值"),opts.MarkLineItem(type_="max", name="最大值"),opts.MarkLineItem(type_="average", name="平均值"),]),)
)
bar.render_notebook()

以30平米为例:​​​​​​​

西城区的住房价格最高,为4350元通州区的租房价格最低,为1620元价格差距还是很大的。

2.分析分析各户型占比及价格分布

layouts=list(set(data['户型']))
layout=data.loc[:,'户型'].value_counts()
from pyecharts import options as opts
from pyecharts.charts import Pie
print(list(layout.index)[:10])
values=[int(i) for i in list(layout.values)[:10]]
pie = (Pie().add("",[(i,j)for i,j in zip(list(layout.index)[:10],values)],radius=["30%", "75%"],center=["40%", "50%"],rosetype="radius",label_opts=opts.LabelOpts(is_show=False),).set_global_opts(title_opts=opts.TitleOpts(title="北京市各区出租房户型占比"),legend_opts=opts.LegendOpts(type_="scroll", pos_left="85%", orient="vertical"),).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c},{d}%"))
)
pie.render_notebook()

由于户型种类比较多,所以我只选了前10种,从图中可以看出,房源主流是1室1厅1卫,占比41.86%,其次分别是是2室1厅1卫、1室0厅1卫,各占比30.58%和11.02%

cut_n=list(range(0,12000,1000))
income=pd.cut(data["价格"],cut_n)
price_cut=data['价格'].groupby(income).count()
index=list(price_cut.index)
index=[str(i) for i in list(price_cut.index)]
values=[int(i) for i in list(price_cut.values)]
pie = (Pie().add("",[(i,j)for i,j in zip(index,values)],radius=["30%", "75%"],center=["40%", "50%"],rosetype="radius",label_opts=opts.LabelOpts(is_show=False),).set_global_opts(title_opts=opts.TitleOpts(title="北京市各区出租房户型占比"),legend_opts=opts.LegendOpts(type_="scroll", pos_left="85%", orient="vertical"),).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:  {c}, {d}%"))
)
pie.render_notebook()

目前,主流的租房价格在3000至6000元,占比50%左右,最便宜有1000元以下的,位置相对较偏,且面积在20平以内;贵的有1万多的,这种一般面积在100平以上,位置在主城区。

3.房子位置分布

根据上述分析情况和我的预算,我决定在朝阳区找一套合适的房子,取出价格在4000至6000元的数据,另存表格,并将表格导入水经注地图下载器中

com_data=data[data['价格'].le(6000)]
com_data=com_data[com_data['价格'].ge(3000)]
com_data=com_data[com_data['行政区']=='朝阳区']
com_data.to_csv('心仪房子.csv',encoding='gbk')

结果展示如下:

下面红色数字为租房价格,这样找起房子来就更方便了

在这里还是要推荐下我自己建的Python开发学习群:1156465813,群里都是学Python开发的,如果你正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2020最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深入Python的小伙伴!

python分析北京租房现状,最后的价格分布地图亮了相关推荐

  1. python最终价格_python分析北京租房现状,最后的价格分布地图亮了

    租房信息已经有了,为了能对北京目前的租房市场有个直观认识,我对数据进行深度分析,并进行可视化展示 从分析结果中,我得到了哪些位置房源多.各区租房平均价格以及心仪价格地理位置分布等重要信息,为帮助我租房 ...

  2. Python分析北京PM2.5,原来每年的值都在变少......

    什么是PM2.5 pm为英文particulate matter的缩写,翻译成中文叫做颗粒物.pm2.5是指大气中直径小于或等于2.5微米的颗粒物,有时也被称作入肺颗粒物.我们日常常见的雾霾天气大 多 ...

  3. 用Python分析北京蛋壳公寓租房数据

    前言 大家好,我是J哥. 近期,蛋壳公寓"爆雷"事件持续发酵,期间因拖欠房东房租与租客退款,蛋壳公寓陷入讨债风波,全国多地蛋壳公寓办公区域出现大规模解约事件,而作为蛋壳公寓总部所在 ...

  4. python实现北京租房信息计算

    案例说明 在本次案例中,我们将通过 Python 爬虫技术获取某网数万条北京租房数据,用北京部分城区真实房价分析真实的房租情况:数据获取.数据清洗预览.数据分析可视化,一起了解最近房租的状况. 本次实 ...

  5. 第5篇-分析北京租房的房源信息

    提前声明:该专栏涉及的所有案例均为学习使用,如有侵权,请联系本人删帖! 文章目录 一.前言 二.网站分析 三.代码编写 一.前言 最近北京的房租是越来越贵了,钱包的钱有点不够呀 因此觉得把北京租房的房 ...

  6. python分析政策实施前后_使用Python分析北京积分落户数据,分析完我陷入了深思...

    北京积分落户制是北京市政协建议推行积分落户政策,以科技贡献.专业技能.在京时间等指标为考核项,计算非京籍人才的"积分",积分达标即可落户北京.也给了我们一众北漂希望,毕竟随着时间的 ...

  7. 使用Python分析北京积分落户数据,分析完我陷入了深思

    这是学习笔记的第 2183 篇文章 读完需要 9 分钟 速读仅需5分钟 北京积分落户制是北京市政协建议推行积分落户政策,以科技贡献.专业技能.在京时间等指标为考核项,计算非京籍人才的"积分& ...

  8. 使用Python分析最新2000封电子邮件的时间分布

    程序功能:运行后要求输入126邮箱地址和密码,然后绘制柱状图显示最新2000封邮件的时间分布. 如果使用其他邮箱系统的话,可以自行搜索和替换pop服务器地址. 参考代码: 运行结果: -------- ...

  9. python分析成都房租信息,以及利用高德API查找租房

    python分析成都租房信息,以及利用高德API查找租房 使用的技术 效果 爬虫 需要爬取的网页分析 爬虫源码 数据可视化 利用高德API查找租房 github地址 使用的技术 爬虫:Beautifu ...

最新文章

  1. Linux 双网卡绑定测试
  2. [asp.net core]project.json(1)
  3. Thread.Join()用法的理解
  4. tomcat设置https访问
  5. Java中使用SQLite数据库
  6. mac改变文件权限git识别为修改的问题
  7. java jdom 更新xml_Java中使用JDOM来修改XML文档(续前)
  8. 一个小例子对多态简单的理解
  9. 2019下半年系统集成项目管理工程师下午真题
  10. ASP.NET 前端Ajax获取数据并刷新
  11. Linux C - symlink 和 readlink - 符号链接
  12. 【开发工具】Blender制作简单动画
  13. selenium安装和chromedriver下载安装
  14. Rexroth力士乐工控机触摸屏维修SYSTEM200概述
  15. android简单小程序课程设计,微信小程序课程设计报告
  16. 双网卡上网冲突解决_【优特普.安防百科】交换机组网最常见的8大故障及解决方式...
  17. 【STM32f401学习之路-00】搭建工程环境
  18. Linux配置免密码登录(原理 + 实践)
  19. ​一文看尽MAE最新进展!恺明的MAE已经提出大半年,目前发展如何?
  20. mybase6.0.4的license key的生成方法

热门文章

  1. [Vue][面试]谈谈你对MVC、MVP和MVVM的理解
  2. 超好用的视频编辑工具:Movavi Video Editor 15 for Mac
  3. [python]re库(正则表达式)的小练习-抓取北航教务处通知列表
  4. 阻燃电缆ZR,ZA,ZB,ZC分别是什么意思,有什么区别
  5. flow hive 新型蜂箱_流动的蜂蜜盛宴:Flow Hive蜂箱获数百万美元众筹款
  6. 湖北二本计算机大学录取分数线,湖北二本投档分数线
  7. c#餐饮系统打印机_C#打印机操作类
  8. mpp region osd反色
  9. 有关ros kinetic无法安装报错unmet dependencies及解决
  10. C#快递单号查询接口物流路由信息快递鸟api代码接入.Net