python数据分析—10000条北京二手房装修特征信息可视化分析(附源码)
文章目录
- 开发工具
- 数据内容
- 实现代码
- 运行效果
- 处理异常数据
- 优化异常数据运行结果
- 10000条二手房信息下载地址
- 总结
开发工具
python版本:Python 3.6.1
python开发工具:JetBrains PyCharm 2018.3.6 x64
第三方库:pandas ;matplotlib ;seaborn
数据内容
实现代码
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as pltplt.style.use('fivethirtyeight')sns.set_style({'font.sans-serif': ['simhei', 'Arial']})lianjia_df = pd.read_csv('lianjia.csv')# 添加房屋均价
df = lianjia_df.copy()
df['PerPrice'] = round(lianjia_df['Price'] / lianjia_df['Size'], 2)# 重新摆放列位置
columns = ['Region', 'District', 'Garden', 'Layout', 'Floor', 'Year', 'Size', 'Elevator', 'Direction', 'Renovation','PerPrice', 'Price']
df = pd.DataFrame(df, columns=columns)f, [ax1, ax2, ax3] = plt.subplots(3, 1, figsize=(20, 20))# 建房装修特征分析
sns.countplot(df['Renovation'], ax=ax1)
sns.barplot(x='Renovation', y='Price', data=df, palette='Set3', ax=ax2)
sns.boxplot(x='Renovation', y='Price', data=df, ax=ax3)plt.show()
运行效果
从第一张装修风格和数量关系图中可以看到,精装修的数量最多,其次是简装的, 多了一个南北的异常数据,需要做处理
处理异常数据
先查看装修风特征数量,在对异常数据进行剔除处理
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as pltplt.style.use('fivethirtyeight')sns.set_style({'font.sans-serif': ['simhei', 'Arial']})lianjia_df = pd.read_csv('lianjia.csv')# 添加房屋均价
df = lianjia_df.copy()
df['PerPrice'] = round(lianjia_df['Price'] / lianjia_df['Size'], 2)# 重新摆放列位置
columns = ['Region', 'District', 'Garden', 'Layout', 'Floor', 'Year', 'Size', 'Elevator', 'Direction', 'Renovation','PerPrice', 'Price']
df = pd.DataFrame(df, columns=columns)print(df['Renovation'].value_counts()) # 查看装修风特征数量
df = df[(df['Renovation'] != '南北')] # 去掉南北的异常值
df['Renovation'] = df.loc[(df['Renovation'] != '南北'), 'Renovation'] # 去掉南北的异常值f, [ax1, ax2, ax3] = plt.subplots(3, 1, figsize=(20, 20))# 建房装修特征分析
sns.countplot(df['Renovation'], ax=ax1)
sns.barplot(x='Renovation', y='Price', data=df, palette='Set3', ax=ax2)
sns.boxplot(x='Renovation', y='Price', data=df, ax=ax3)plt.show()
优化异常数据运行结果
10000条二手房信息下载地址
https://url71.ctfile.com/f/13238771-530323628-1950bb
(访问密码:8835)
总结
这里主要运用了python的进行数据分析时,注意从图中分析异常数据,在对相关数据进行过滤掉
python数据分析—10000条北京二手房装修特征信息可视化分析(附源码)相关推荐
- python数据分析—10000条北京二手房电梯信息可视化分析(附源码)
文章目录 开发工具 数据内容 实现代码 运行效果 处理异常数据 优化异常数据运行结果 10000条二手房信息下载地址 总结 开发工具 python版本:Python 3.6.1 python开发工具: ...
- Python 实现图片格式转换,jpg\png\webp等,附源码
Python 实现图片格式转换,jpg\png\webp等,附源码 需要使用 PIL库,但python 3是无法安装该库的,如果是python 3安装pillow库即可. 1.安装 python 2 ...
- python爬取天气预报源代码_python抓取天气并分析 实例源码
[实例简介] Python代码抓取获取天气预报信息源码讲解.这是一个用Python编写抓取天气预报的代码示例,用python写天气查询软件程序很简单.这段代码可以获取当地的天气和.任意城市的天气预报, ...
- Python采集3000条北京二手房数据,看我都分析出了啥?
最近呢,对链家平台上的北京二手房数据做了个可视化分析,对目前北京的二手房交易情况有了个大致了解,最终得到一个很实在的结论:奋斗一辈子也买不到一个厕所这句话不是骗人的,是真的:关于具体分析内容请看下文 ...
- Python爬虫 —3000+条北京二手房数据可视化分析
关注公众号:[小张Python],为你准备了 50+ 本Python 精品电子书籍 与 50G + 优质视频学习资料,后台回复关键字:1024 即可获取:如果对博文内容有什么疑问,公众号后台添加作者[ ...
- Python数据分析之使用pandas-datareader获取国家经济信息进行分析
pandas-datareader背景介绍 当熟悉了Pandas的两个主要数据结构:Series和DataFrame之后,我们就可以使用pandas-datareader进行金融财经数据的导入和初步分 ...
- Python爬虫实战,requests+openpyxl模块,爬取手机商品信息数据(附源码)
前言 今天给大家介绍的是Python爬取手机商品信息数据,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这样的纯文本 ...
- Python爬虫教程:爬取王者荣耀全套皮肤【附源码】
怎么获取全套皮肤?用钱买,或者用爬虫爬取下来~虽然后者不能穿.这个案例稍微复杂一点,但是一个非常值得学习的项目. 具体实现思路: 分析网页源代码结构 找到合适的入口 穷举访问并解析 爬取所有英雄所有皮 ...
- 【爬虫实战项目】Python爬虫批量下载音乐飙升榜并保存本地(附源码)
前言 今天给大家介绍的是Python爬虫批量下载音乐飙升榜并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是 ...
最新文章
- 用Python对XML读取和处理
- 多线程搜索磁盘上的文件
- 1008 数组元素循环右移问题 (20分)
- 如何在Web用户控件中引用样式表中的样式
- Hybrid A*论文解析(3)
- 神奇的linux发行版 tiny core linux
- 计算机与交互式白板通过USB数据线,选购交互式电子白板注意哪些事项【详细介绍】...
- 4.1下午英语阅读视频
- php编写程序计算积分_PHP论坛实现积分系统的思路代码详解
- matlab三维热传导计算,matlab练习程序(差分法解二维热传导方程)
- 出租车计费程序php,出租车计价器VHDL程序
- 2019-1-25 画图:画风玫瑰图
- 大型网站 + 静态页面
- Java中XML运用总结
- 7.网络基础配置实验报告(2)
- POCO C++ 在IOS上的使用
- Linux+conda+R+Rstudio下载安装环境全方面配置
- DPU-PYNQ使用笔记
- 组件化、模块化、Composing Builds
- 13_冒泡算法(附完整java代码)