用八爪鱼从链家网二手房抓取北京、上海、广州、深圳、成都、天津、杭州、哈尔滨、保定、厦门、沈阳、三亚、武汉、南京、张家口十五个城市的房源,每个城市约1000条。
一、提出问题:
城市房价排名是怎样的?
各个城市新老小区的占比是怎样的?
北京的房价受哪些因素影响?
哪户型的房子关注量最大?卖家主力售卖哪种?
实际问题:如果想在北京购买两室一厅大约八十到九十平的房子,最少预算是多少?
二、进行数据清洗
清洗前:


数据清洗后(包括户型、建筑面积、位置、单价、总价、建成年份、装修情况、关注人数等字段)

三、数据分析

1、用数据透视表对各个城市的房价情况进行汇总

数据透视图如下:

从图中可以看出房价位于前三的城市是北京、深圳和上海,张家口的房价最低,其次是哈尔滨。
分析: 根据2018年城市分级,属于一线城市的北京、上海、深圳、广州是位于前列的平均房价在3万5到7万之间,而北京几乎是广州的二倍。属于新一线城市的杭州、南京、天津、武汉、成都、沈阳平均房价在1万到4万之间,属于二线城市的保定、哈尔滨平均房价在一万左右,而同属于二线城市的厦门,房价却比一些一线城市高,可能是由于厦门是旅游城市,旅游业发达,而面积较小,房源供不应求,所以造成房价偏高。

2、各个城市新老小区的占比情况
去掉没有统计到年代的天津、哈尔滨、保定、张家口和三亚,早期(2000年以前),中期(2001到2008年间),近期(2009年至今)建成的房源,按城市的百分比如图表所示


可以看出北京、上海、广州和深圳的房源大多建于2008年以前。而成都、沈阳和武汉2008年后建成的房源占比较大。近期新一线城市为保留以及吸引人才,进行城市扩建,土地开发,房地产行业迅猛发展。

3.探究影响北京房价的因素
对数据透视表进行切片。

(1)装修因素



简装均价59360.21667 元/平米
精装均价63475.2869 元/平米
毛坯房均价57847.625 元/平米
可以看出房价精装>简装>毛坯房
分析:对于卖家来讲,对房子进行一定程度的装修,每平可以多卖约5000元。对于买家来讲,如果预算不高,且对于房子的装修要求不高,可以考虑买简装房,每十平约省五万元。

(2)有无电梯


无电梯:54565.54913元/平米
有电梯均价:63532.82645元/平米
分析:有电梯的房子比没电梯的房子价格能高出一万元,因此是影响房价的重要因素。此因素与接下来要分析的建成时间因素有重叠部分,早期的房子由于楼层较低,电梯较少,房龄较高,房价自然低。

(3)建成时间



早期:58720.8972 元/平米
中期:62722.10454 元/平米
近期:61268.46774 元/平米
可以看出,2008年以后的房价明显高于2008年以前的,与前面的预测一致。

综上所述装修、电梯情况以及建成时间对房价是有较大影响的,当然对房价影响因素不知这些,房源的位置、高度和朝向也是有一定影响的。
4、哪种户型关注人数最多,卖家主力售卖哪种?


从图表可以看出,两室一厅的户型是关注人数最多的,于此对应卖家主力售卖的也是两室的房子。

5、实际问题:80-90平简装的两室一厅,最低预算?在哪买?

从数据中可以看出,位于回龙观区域的房子是价格较低的,均价约每平五万元,总价约为400到500万。

北京的房子再远也是很贵,如果去附近城市,如天津和保定情况会是怎样呢?
接下来,打算换一种数据统计方式,用mysql对其它城市的情况进行分析。

用EXCEL分析房价相关推荐

  1. 使用Excel分析数据学习笔记之 二分类与混淆矩阵

    使用Excel分析数据学习笔记之 二分类与混淆矩阵 混淆矩阵的构成: e.g.1:Bombers and seagulls 案例背景 混淆矩阵 如何根据混淆矩阵得到ROC曲线? 如何设定最佳阈值(op ...

  2. excel分析数据的工具有哪些?

    ​数据分析,除了Excel数据透视表,还有什么工具? 经常听到同事说: "Excel很难,做个简单图表还行,一看到透视表就晕." "作为表哥表姐,每天的工作就是复制粘贴, ...

  3. 免疫组库数据分析(二):Excel 分析免疫组库数据

    免疫组库数据分析(二):Excel 分析免疫组库数据 前言 在系列文章第一篇<免疫组库数据分析(一):windows 系统下MiXCR的安装和使用>讲解了5'RACE实验数据如何在Wind ...

  4. excel分析图表制作,如何轻松创建折线图、柱状图、饼图

    ​在Excel中通过数据间的关系选择合适的图表,轻松创建折线图.柱状图.饼图使其表达的主题和内容更加简单清晰. 下面我们通过Smartbi大数据分析工具介绍excel分析图表制作方法,如何制作常用的图 ...

  5. python利用excel分析过杀漏失

    python利用excel分析过杀漏失 from openpyxl import load_workbook from utils import * from tqdm import tqdm imp ...

  6. 量化经济学:手把手教你如何使用EXCEL分析股票历史数据

    1.数据来源获取 数据集的下载来源为Yahoo Finance.Yahoo Finance是雅虎公司金融媒体领域的一个相关网站.它提供财经新闻.数据和评论,包括股票报价.新闻稿.财务报告和原创内容.它 ...

  7. 用Excel分析音视频同步

    声明:     这里主要介绍如何运用Excel来分析音视频是否同步,希望可以对大家有所帮助. 介绍:     学习音视频就一定要知道做音视频同步,而现在我们来分析音视频同步的工具也是有的,比如easy ...

  8. 2.0 案例2:爬取房源信息以及分析房价

    课前说明:本章节请求的 url 部分用 ** 代替 本章节需要掌握的知识点: 1.如何用 xpath 解析数据: 2.如何用 csv 存储数据(注:由于字典是无序的,所以写入csv时,表头可能跟内容搭 ...

  9. Excel分析数据功能教程

    制作数据表可能不难,但分析其中的数据时,使用公式寻找重要结论的过程往往让人抓耳挠腮.现在,<Excel>推出了"分析数据"功能,可以创建一系列推荐图表和数据表,让你不需 ...

  10. excel两个指标相关性分析_如何用excel分析两组数据的相关性

    在Excel进行数据分析的时候,经常要分析两组数据的相关性.求出的值越接近1,那就说明相关性越大:越接近0,说明相关性越小.下面就说说具体步骤. 具体步骤如下所示: 1. 数据分析,以比较男女两组身高 ...

最新文章

  1. JDBC--Statement,PreparedStatement,CallableStatement的区别
  2. python标准库导入语句有哪些_如何将python标准库缺失的进行导入?
  3. AtCoder AGC030C Coloring Torus (构造)
  4. ffmpeg 源码学习
  5. CVPR2021 最佳论文候选—提高图像风格迁移的鲁棒性
  6. python列表截取双冒号“::“用法
  7. Inception 模型
  8. java语言实现_java语言实现树
  9. Android Gradle 完整指南(转)
  10. mongodb数据的导入导出备份恢复
  11. html导航栏所有页面通用,在所有页面中包含HTML导航栏
  12. vulhub漏洞复现- ActiveMQ 反序列化漏洞(CVE-2015-5254)
  13. 瀑布流布局 js定位
  14. IPv6 address示例
  15. 惊呆了!无聊感可激发创造力
  16. Codevs 1586 学校食堂
  17. 解决canon LBP 6200只能打印单面的问题
  18. 最新!中国内地大学ESI排名出炉:362所高校上榜!
  19. 数学建模—投资组合问题
  20. CultureInfo 類別

热门文章

  1. Pascal------第三方库
  2. 继电器rc吸收电路取值_RC吸收电路
  3. XMPP中文 XEP-0045: 多用户聊天(一)
  4. 分贝相关概念及转换:dB、dBSPL、dBm、dBu、dBV、dBFS
  5. 网络拓扑图:网络拓扑图介绍及在线制作
  6. 反击网络执法官[转]
  7. php对接触动精灵,触动精灵万能连点器 Lua 源码
  8. [雨林木风][番茄花园][电脑公司][深度论坛][龙帝国]系统光盘收录大全(精品)
  9. ember new报错No matching version found for @ember-data/model@^3.11.2的解决方案
  10. 简单工厂模式与策略模式