前言

白岩松曾说:“高房价正在毁掉无数年轻人的爱情,毁灭了年轻人的想象力。”尤其是北上广深这类一线城市,对于一般的工薪阶层,买房更是难上加难。前不久,DT财经写了一篇文章《我只有300万预算,能在上海买到什么样的房子?》,引起了网友广泛热议。有人不禁要问,那在深圳买房又得要多少预算呢?

于是,为了深入了解深圳二手房交易市场,我用Pyhton采集了深圳在售20778套二手房数据并分析,试图从数据层面了解深圳二手房市场现状。

数据探索与可视化

深圳二手房历年走势

首先,我们看一下深圳近年来二手房房价整体走势图。由图可知,2011年深圳二手房价仅为18495元/㎡,至2019年增长至62205元/㎡,增加了2.36倍。然而深圳平均工资增加不到2倍。可见,一般的工薪阶层购房压力增加也是情理之中。

深圳二手房在售房源分布

深圳二手房源主要分布在龙岗区,共计12747万套。坪山区和大鹏新区二手房源相对较少,分别为762套和340套。

深圳在售二手房房价分布

从深圳在售的二手房均价来看,南山区均价最高,高达81241元/㎡,其次是福田区和罗湖区,二手房均价分别为72114元/㎡和53070元/㎡。光明区房价最低,为22893元/㎡。

在深圳买一套二手房到底要花多少钱?我们分析了二手房的价位,从图中可以看到总价在300-500万内的最多,占比达到30.53%。500-800万的占比29.85%。300万以下的占比17.84%。

深圳在售二手房房龄分布

这些二手房的房龄都有多久了呢?由图可知,房龄在15-20年的最多,占比23.37%,其次是房龄在10-15年,占比21.51%。5年以内的仅占比17.63%。

不同居室二手房数量及均价

深圳二手房中,3室2厅、2室1厅和3室1厅的二手房源数量最多,5室以上的房源较少。影响二手房房价的因素很多,居室越多房价不一定就更高,由图可知,1室0厅的均价也达到了75121元/㎡。

不同朝向二手房源数量

深圳在售二手房中,朝南的房源占比最大,达31.72%,朝东南和西南次之,分别为26.10%和8.94%。

深圳在售二手房房源TOP10楼盘

由图可知,龙光玖钻在售二手房数量最多,达到150个,其次是龙光玖云著,为130个房源。

楼层数、建筑面积与房价的关系

通过绘制楼层与房价、建筑面积与房价回归图可知,深圳在售二手房楼层类型分布较为分散,且楼层与房价的相关性不大,建筑面积集中分布在200㎡内,且建筑面积与房价具有较强的正相关。

PS:如有需要Python学习资料的小伙伴可以加下方的群去找免费管理员领取

可以免费领取源码项目实战视频PDF文件

数据获取

本次数据来源于贝壳找房,限于篇幅,以下仅提供核心代码:

def main():district_list = ['luohuqu', 'futianqu','nanshanqu', 'yantianqu','baoanqu', 'longgangqu','longhuaqu', 'guangmingqu','pingshanqu', 'dapengxinqu']  #地区for district in district_list:for page in range(1,101):   #页数控制url = 'https://sz.ke.com/ershoufang/{0}/pg{1}/'.format(district, page)# print(url)response = requests.request("GET", url, headers = headers)print(response.status_code)if response.status_code == 200:re = response.content.decode('utf-8')print("正在提取" + district +'第' + str(page) + "页")time.sleep(random.uniform(1, 2))print("-" * 80)# print(re)parse = etree.HTML(re)  # 解析网页num = ''.join(parse.xpath('//*[@id="beike"]/div[1]/div[4]/div[1]/div[2]/div[1]/h2/span/text()'))print(num)parse_page(parse)if int(num) == 0:breakif __name__ == '__main__':ua = UserAgent(verify_ssl=False)headers = {"User-Agent": ua.random}time.sleep(random.uniform(1, 2))main()

数据清洗

本次数据清洗主要用到正则表达式,以下为数据清洗完整代码:

import csv, re
import pandas as pdresult = []
rule1 = re.compile("(.+层)\(共(\d+)层\)")
rule2 = re.compile("(\d+)年建")
rule3 = re.compile("\d+室\d+厅")
rule4 = re.compile("([\d\.]+)平米")
rule5 = re.compile("([\d\.]+)")with open("./ershoufang_shenzhen.csv", encoding="utf-8-sig") as f:f_csv = csv.reader(f)headers = next(f_csv)print(headers)for row in f_csv:tmp = {}tmp["楼盘名称"] = row[0]split_arr = re.sub("\n? {2,}\|?", "|", row[1]).split("|")for s in split_arr:s = s.strip()match = rule1.match(s)if match:tmp["楼层类型"] = match.group(1)tmp["楼层数"] = int(match.group(2))continuematch = rule2.match(s)if match:tmp["建造时间"] = match.group(1)continuematch = rule3.match(s)if match:tmp["户型"] = match.group(0)continuematch = rule4.match(s)if match:tmp["建筑面积(平米)"] = float(match.group(1))continuetmp["朝向"] = ssplit_arr = row[2].split("/")tmp["关注人数"] = int(split_arr[0].replace("人关注", ""))tmp["发布时间"] = split_arr[1].replace("发布", "")tmp["房价(单位:万)"] = float(row[3])tmp["单价(元/平米)"] = float(rule5.search(row[4]).group(1))result.append(tmp)
df = pd.DataFrame(result)
df.to_excel("result.xlsx", index=False)

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:J哥

只有300万预算,能在深圳买到什么样的二手房?分析20778套二手房相关推荐

  1. 我只有300万预算,能在上海买到什么样的房子?

    ▼ 更多精彩推荐,请关注我们 ▼ 本文转自公众号    DT财经(DTcaijing) 走在大城市的街头,你能看到诸多梦想中的元素--名车.豪宅.各式潮流符号--但如果你想在这里定居,遍地开花的房产中 ...

  2. 40万预算X3 glc q5买哪个好?

    买这三款车还是分用途,看职业,分性别吧.生意人买GLC,公职人员买Q5,一般打工人买X3.女孩子买白色GLC,白色X3,摇下车窗看里边都很赏心悦目.男孩子黑色任意一款都OK.撩妹的话开白色GLC成功率 ...

  3. Python爬取20778套深圳二手房并数据分析

    白岩松曾说:"高房价正在毁掉无数年轻人的爱情,毁灭了年轻人的想象力."尤其是北上广深这类一线城市,对于一般的工薪阶层,买房更是难上加难.前不久,DT财经写了一篇文章<我只有3 ...

  4. 中级响应代表什么事件_15万预算,能买到合格的中级轿车吗?

    Hello小伙伴们大家好!上一期我们讨论了15万预算,买入门豪华还是主流合资紧凑级轿车的问题,而不少小伙伴可能忽略的一点是,15万以内的区间,如今已经能买到不少中型轿车了.比如自主品牌阵营中,吉利博瑞 ...

  5. 一朋友手头有98万,想在深圳买房,网友的回复很扎心!

    一朋友手头有98万,想在深圳买房,预算300-350万区间,不知道在哪里买好. 前段时间去宝安看了几个楼盘,发现98万想在深圳买房越来越难了,不少楼盘单价都略涨了,销售人员一听只有98万预算,态度立马 ...

  6. 福建区块链数字经济发展专项资金申报启动,最高可获300万 | 产业区块链发展周报...

    政策补贴 福建省发展和改革委员会关于组织申报人工智能.5G.区块链等2021年省数字经济发展专项资金的通知 最高补贴:300万 申报日期:2021-08-01 至 2021-08-15 申报要求: ( ...

  7. 0成本300万UV,打造爆款的6个方法论(附大会PPT下载)

    什么是营销爆款? 在0成本投入的情况下可以在10天内感染300万人以上的UV:或者在少量资金的推动下可以在10天内感染1000万以上的UV. 本文为2017中国产品经理大会上海站嘉宾分享整理总结 未经 ...

  8. 区块链+体育赛事怎么玩?拥有300万用户的格斗迷有话说

    ​ 本堂茜 渡鸦区块链专栏记者 市场背景 体育产业已成为国际公认的 21 世纪最具活力,是具有高渗透性.交叉性.拉动性的朝阳产业. 健康产业.绿色产业.足球是全球体育产业中最大的单一项目,全球年产值超 ...

  9. 他曾创造多门编程语言,还被比尔·盖茨以300万美元挖角

    C#之父 Anders Hejlsberg : from Google 1. 少年时教老师学计算机 安德斯·海尔斯伯格(Anders Hejlsberg),1960 年出生于丹麦哥本哈根,Turbo ...

最新文章

  1. python用jieba进行分词并可视化
  2. Android 通过http协议数据交互
  3. 使用Docker-数据卷挂载案例1
  4. 【PAT - 甲级1094】The Largest Generation (25分)(dfs建树)
  5. 听说这样可以加快oracle入表速度
  6. cetnos6.4 基础版安装
  7. rs485接口上下拉_通讯接口应用笔记1:RS485通讯上下拉电阻的选择
  8. 乌龟git安装和使用
  9. 如何安装SQL server2005的查询分析器(绝对原创)
  10. mysql handler socket_mysql-handlersocket
  11. Python tkinter库之Canvas 根据函数解析式或参数方程画出图像
  12. python计算等额本息还款房贷_一个简单的房贷计算器(等额本息)
  13. google play以及google pay
  14. 快递系统java实验报告_java模拟物流快递系统程序.doc
  15. 自己的邮箱还有在用吗,还安全吗?
  16. 电脑重启bootmgr_电脑出现bootmgr is missing怎么办
  17. Error:java: 读取xxx.jar时出错; zip file is empty
  18. android 项目大全,总有你所需的
  19. GTD--时间管理机制
  20. 四、VUE基础学习篇(循环v-for)- v-for、v-bind:key

热门文章

  1. TUF Notary
  2. 如何使用HTML5自定义数据属性以及原因
  3. 沈阳警方严查违法非法烟花爆竹 捣毁多处储存窝点
  4. 华为android5.1版本,华为P10国行版搭载的EMUI5.1怎么样?
  5. 五次面试,程序员的悲催轮回
  6. java 方法规范_Java规范推荐
  7. 串口波特率等概念(转https://blog.csdn.net/dagefeijiqumeiguo/article/details/68921820)
  8. Oracle-OSP-Process->OSP Requisition Qty Is Not Matching With Discrete Job‘s Qty (Doc ID 2289283.1)
  9. android手机 恢复微信图片,OPPO R9s Plus怎么找回微信聊天图片?恢复微信误删图片方法推荐...
  10. 【增强版短视频去水印源码】去水印微信小程序+去水印软件源码