文章目录

  • 开发工具
  • 数据内容
  • 实现代码
  • 运行效果
  • 处理异常数据
  • 优化异常数据运行结果
  • 10000条二手房信息下载地址
  • 总结

开发工具

python版本:Python 3.6.1

python开发工具:JetBrains PyCharm 2018.3.6 x64

第三方库:pandas ;matplotlib ;seaborn

数据内容

实现代码

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as pltplt.style.use('fivethirtyeight')sns.set_style({'font.sans-serif': ['simhei', 'Arial']})lianjia_df = pd.read_csv('lianjia.csv')# 添加房屋均价
df = lianjia_df.copy()
df['PerPrice'] = round(lianjia_df['Price'] / lianjia_df['Size'], 2)# 重新摆放列位置
columns = ['Region', 'District', 'Garden', 'Layout', 'Floor', 'Year', 'Size', 'Elevator', 'Direction', 'Renovation','PerPrice', 'Price']
df = pd.DataFrame(df, columns=columns)f, [ax1, ax2, ax3] = plt.subplots(3, 1, figsize=(20, 20))# 建房装修特征分析
sns.countplot(df['Renovation'], ax=ax1)
sns.barplot(x='Renovation', y='Price', data=df, palette='Set3', ax=ax2)
sns.boxplot(x='Renovation', y='Price', data=df, ax=ax3)plt.show()

运行效果

从第一张装修风格和数量关系图中可以看到,精装修的数量最多,其次是简装的, 多了一个南北的异常数据,需要做处理

处理异常数据

先查看装修风特征数量,在对异常数据进行剔除处理

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as pltplt.style.use('fivethirtyeight')sns.set_style({'font.sans-serif': ['simhei', 'Arial']})lianjia_df = pd.read_csv('lianjia.csv')# 添加房屋均价
df = lianjia_df.copy()
df['PerPrice'] = round(lianjia_df['Price'] / lianjia_df['Size'], 2)# 重新摆放列位置
columns = ['Region', 'District', 'Garden', 'Layout', 'Floor', 'Year', 'Size', 'Elevator', 'Direction', 'Renovation','PerPrice', 'Price']
df = pd.DataFrame(df, columns=columns)print(df['Renovation'].value_counts())  # 查看装修风特征数量
df = df[(df['Renovation'] != '南北')]  # 去掉南北的异常值
df['Renovation'] = df.loc[(df['Renovation'] != '南北'), 'Renovation']  # 去掉南北的异常值f, [ax1, ax2, ax3] = plt.subplots(3, 1, figsize=(20, 20))# 建房装修特征分析
sns.countplot(df['Renovation'], ax=ax1)
sns.barplot(x='Renovation', y='Price', data=df, palette='Set3', ax=ax2)
sns.boxplot(x='Renovation', y='Price', data=df, ax=ax3)plt.show()

优化异常数据运行结果

10000条二手房信息下载地址

https://url71.ctfile.com/f/13238771-530323628-1950bb
(访问密码:8835)

总结

这里主要运用了python的进行数据分析时,注意从图中分析异常数据,在对相关数据进行过滤掉

python数据分析—10000条北京二手房装修特征信息可视化分析(附源码)相关推荐

  1. python数据分析—10000条北京二手房电梯信息可视化分析(附源码)

    文章目录 开发工具 数据内容 实现代码 运行效果 处理异常数据 优化异常数据运行结果 10000条二手房信息下载地址 总结 开发工具 python版本:Python 3.6.1 python开发工具: ...

  2. Python 实现图片格式转换,jpg\png\webp等,附源码

    Python 实现图片格式转换,jpg\png\webp等,附源码 需要使用 PIL库,但python 3是无法安装该库的,如果是python 3安装pillow库即可. 1.安装 python 2 ...

  3. python爬取天气预报源代码_python抓取天气并分析 实例源码

    [实例简介] Python代码抓取获取天气预报信息源码讲解.这是一个用Python编写抓取天气预报的代码示例,用python写天气查询软件程序很简单.这段代码可以获取当地的天气和.任意城市的天气预报, ...

  4. Python采集3000条北京二手房数据,看我都分析出了啥?

    最近呢,对链家平台上的北京二手房数据做了个可视化分析,对目前北京的二手房交易情况有了个大致了解,最终得到一个很实在的结论:奋斗一辈子也买不到一个厕所这句话不是骗人的,是真的:关于具体分析内容请看下文 ...

  5. Python爬虫 —3000+条北京二手房数据可视化分析

    关注公众号:[小张Python],为你准备了 50+ 本Python 精品电子书籍 与 50G + 优质视频学习资料,后台回复关键字:1024 即可获取:如果对博文内容有什么疑问,公众号后台添加作者[ ...

  6. Python数据分析之使用pandas-datareader获取国家经济信息进行分析

    pandas-datareader背景介绍 当熟悉了Pandas的两个主要数据结构:Series和DataFrame之后,我们就可以使用pandas-datareader进行金融财经数据的导入和初步分 ...

  7. Python爬虫实战,requests+openpyxl模块,爬取手机商品信息数据(附源码)

    前言 今天给大家介绍的是Python爬取手机商品信息数据,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这样的纯文本 ...

  8. Python爬虫教程:爬取王者荣耀全套皮肤【附源码】

    怎么获取全套皮肤?用钱买,或者用爬虫爬取下来~虽然后者不能穿.这个案例稍微复杂一点,但是一个非常值得学习的项目. 具体实现思路: 分析网页源代码结构 找到合适的入口 穷举访问并解析 爬取所有英雄所有皮 ...

  9. 【爬虫实战项目】Python爬虫批量下载音乐飙升榜并保存本地(附源码)

    前言 今天给大家介绍的是Python爬虫批量下载音乐飙升榜并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是 ...

最新文章

  1. 用Python对XML读取和处理
  2. 多线程搜索磁盘上的文件
  3. 1008 数组元素循环右移问题 (20分)
  4. 如何在Web用户控件中引用样式表中的样式
  5. Hybrid A*论文解析(3)
  6. 神奇的linux发行版 tiny core linux
  7. 计算机与交互式白板通过USB数据线,选购交互式电子白板注意哪些事项【详细介绍】...
  8. 4.1下午英语阅读视频
  9. php编写程序计算积分_PHP论坛实现积分系统的思路代码详解
  10. matlab三维热传导计算,matlab练习程序(差分法解二维热传导方程)
  11. 出租车计费程序php,出租车计价器VHDL程序
  12. 2019-1-25 画图:画风玫瑰图
  13. 大型网站 + 静态页面
  14. Java中XML运用总结
  15. 7.网络基础配置实验报告(2)
  16. POCO C++ 在IOS上的使用
  17. Linux+conda+R+Rstudio下载安装环境全方面配置
  18. DPU-PYNQ使用笔记
  19. 组件化、模块化、Composing Builds
  20. 13_冒泡算法(附完整java代码)

热门文章

  1. Docker 本地镜像 推送到指定仓库
  2. 记住这些技术名词就够了
  3. 浏览器的工作原理:输入URL后,Web页面是如何呈现的?
  4. 【动手学深度学习PyTorch版】2 线性回归
  5. cpa禁用计算机型号,注意!Becker官宣:CPA Final review电脑版软件停用!
  6. Windows server 2012搭建用户隔离FTP站点
  7. 记一次操作系统实验测试
  8. 《vulnhub》-记一次 breach靶场实验
  9. UnityHDR渲染管线中使用3dsmax导入的模型丢失贴图恢复
  10. 只靠石墨烯电池,撑不起两轮电动车的“高端梦”