python数据分析实战项目—运用matplotlib可视化分析10000条北京各大区二手房区域信息(附源码)
文章目录
- 开发工具
- 数据内容
- 实现代码
- 运行效果
- 10000条二手房信息下载地址
- 总结
开发工具
python版本:Python 3.6.1
python开发工具:JetBrains PyCharm 2018.3.6 x64
第三方库:pandas ;matplotlib ;seaborn
数据内容
实现代码
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as pltplt.style.use('fivethirtyeight')sns.set_style({'font.sans-serif': ['simhei', 'Arial']})lianjia_df = pd.read_csv('lianjia.csv')# 添加房屋均价: 总价/房屋大小
df = lianjia_df.copy()
df['PerPrice'] = round(lianjia_df['Price'] / lianjia_df['Size'], 2)# 重新摆放列位置
columns = ['Region', 'District', 'Garden', 'Layout', 'Floor', 'Year', 'Size', 'Elevator', 'Direction', 'Renovation','PerPrice', 'Price']
df = pd.DataFrame(df, columns=columns)# 二手房区域分组对比二手房数量和每平米价格
df_house_count = df.groupby('Region')['Price'].count().sort_values(ascending=False).to_frame().reset_index()
df_house_mean = df.groupby('Region')['PerPrice'].mean().sort_values(ascending=False).to_frame().reset_index()f, [ax1, ax2, ax3] = plt.subplots(3, 1, figsize=(20, 20))# 每平米单价对比图
sns.barplot(x='Region', y='PerPrice', palette='Blues_d', data=df_house_mean, ax=ax1)
ax1.set_title('北京各大区二手房每平米单价对比', fontsize=15)
ax1.set_xlabel('区域')
ax1.set_ylabel('每平米单价')# 各区域二手房数量
sns.barplot(x='Region', y='Price', palette='Greens_d', data=df_house_count, ax=ax2)
ax2.set_title('北京各大区二手房数量对比', fontsize=15)
ax2.set_xlabel('区域')
ax2.set_ylabel('数量')# 各区域二手房房屋总价
sns.boxplot(x='Region', y='Price', data=df, ax=ax3)
ax3.set_title('北京各大区二手房房屋总价', fontsize=15)
ax3.set_xlabel('区域')
ax3.set_ylabel('房屋总价')plt.show()
运行效果
从第一个区域与每平米单价图中可以看到,西城、东城和海淀地区价格相对较高
从第二个区域与数量图中可以看到,海淀,朝阳,丰台和昌平数量都在2500以上
从第三个区域与总价图中可以看到,总价的平均价格都在1000以下
10000条二手房信息下载地址
https://url71.ctfile.com/f/13238771-530323628-1950bb
(访问密码:8835)
总结
这里主要运用了python的barplot绘制条形图函数和boxplot箱线图函数分析区域与每平米价格、数量和房屋总价的关系
python数据分析实战项目—运用matplotlib可视化分析10000条北京各大区二手房区域信息(附源码)相关推荐
- Python图像识别实战(三):基于OpenCV实现批量单图像超分辨重建(附源码和实现效果)
前面我介绍了可视化的一些方法以及机器学习在预测方面的应用,分为分类问题(预测值是离散型)和回归问题(预测值是连续型)(具体见之前的文章). 从本期开始,我将做一个关于图像识别的系列文章,让读者慢慢理解 ...
- Python数据分析实战:降雨量统计分析报告分析
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于菜J学Python ,作者小小明 最近遇到一个有点烧脑的需求,其实也不算烧pytho ...
- python量化策略源码_【Python量化投资】趋向系统指标策略 ADX、DMI指标用于股票池(附源码)...
原标题:[Python量化投资]趋向系统指标策略 ADX.DMI指标用于股票池(附源码) [什么是ADX] ADX(average directional indicator) 平均趋向指数,常用的趋 ...
- Python数据分析实战:上海二手房价分析
1 数据搜集 使用 urllib 库中的request 模块爬取赶集网发布的上海二手房信息,包括包括户型.面积.单价等,再使用BeautifulSoup 库解析爬取的HTML数据,最终将数据保存到CS ...
- 数据分析实战项目-蛋壳公寓投诉分析
摘要:由于今年疫情,加速了长租公寓的暴雷,本人所租的蛋壳公寓也频繁传出各种负面新闻,直到10月初合同到期,不敢再续租了,按约退房!押金退还流程先退到APP内,再提现,APP内显示14个工作日到账,截至 ...
- python模拟火车订票系统代码_Python3.6实现12306火车票自动抢票,附源码
原标题:Python3.6实现12306火车票自动抢票,附源码 Python(发音:英[?pa?θ?n],美[?pa?θɑ:n]),是一种面向对象.直译式电脑编程语言,也是一种功能强大的通用型语言,已 ...
- 111个Python数据分析实战项目,代码已跑通,数据可下载
写在前面: 这里整理了111个数据分析的案例,每一个都进行了严格的筛选,筛选标准如下: 1. 有干货:杜绝纯可视化.统计性分析,有一定比例的讲解性文字 2. 可跑通:所有代码均经过测试,(大概率)可以 ...
- 20个python数据分析实战项目(附源码)
1.用python制作炫酷的滚动地球 https://mp.weixin.qq.com/s/mTBhLsO6IuU7l4rme1G1yw 2.python数据分析--pyecharts柱状图全解(小白 ...
- python数据分析实战之阿里巴巴股票行情分析
文章目录 1.明确需求和目的 2.数据收集 3.数据预处理 3.1 加载相关库和数据集 3.2 数据概览 3.3 数据格式处理 3.4 缺失值处理 4.数据分析 4.1 股票K线图 4.2 涨跌情况分 ...
最新文章
- django引入现有数据库
- spring之继承配置
- python画散点图类型-python画时间序列散点图
- java实例域静态域_有关java 实例域 静态域 静态方法
- Qt工程pro文件的配置和头文件和库的添加
- 怎样借助Python爬虫给宝宝起个好名字
- app.config数据库路径问题
- 08年最佳短篇小说《误解》
- 【Matlab学习笔记】【函数学习】cat函数
- 《我是一只IT小小鸟》
- 电脑主机插入耳机无声音
- 放大电路静态工作点的稳定
- 解决docker删除镜像时image is referenced in multiple repositories
- Linux mmap 详解
- 14-射频校准的原理和设置
- 概率论及概率图模型基础
- win10系统无法访问指定设备或路径怎么解决?
- Inno Setup入门(十六)——Inno Setup类参考(2)
- 令人肝肠寸断的100个签名首语
- c语言性格测试小游戏,性格测试小游戏
热门文章
- 百度竞价排名的基本知识
- mysql pacemaker_corosync+pacemaker+drbd+mysql实现高可用
- 维度云工业品ERP进销存软件教您如何突破工业品生意的困境?
- SpringBoot后端统计网站的IP访问次数及地区
- Python 内建函数 - property(fget=None, fset=None, fdel=None, doc=None)
- 快捷键的使用(更新。。)
- IEEE文献免费下载
- python urllib2用法_使用Python urllib2执行PUT
- java培训北大青鸟大兴校区_北大青鸟大兴校区毕业典礼报道!
- 北大青鸟培训第二天:HTML初级代码和相关知识 (持续更新)