houseprice_analysis_广州房子租售比分析(上)
2020.5.31
在XXX等多重因素作用下,作为一棵跨了个行还未走上正轨的小韭菜瑟瑟发抖。
虽然,城市产业链是变化的,JJ重心和JY情况也是动态的:
我无法准确预测某个小区某个板块在未来3年、5年、10年甚至更久,是否还一如既往地繁荣,房子的价值是否一如既往地坚挺,那,就先看看当下,当下的其中一个因素——租售比。
原文提示zz原因审核不通过,那就直接附知乎链接了:
https://zhuanlan.zhihu.com/p/144897449
如果要追溯历史,从全球各国城镇化历史进程来对比分析判断一个城市经济产业、房价等要素的发展轨迹,
那,应该再获取到全球各个城市(尤其一二线城市)过去两百年的动态变化数据,包括各个重要阶段发生的重要事件等信息,多方面考量。
只是,作为一只小萌新,还没这么强大的功力,那就先搞个当下的租售比,粗略看看情况。
"""
"""
# 不写多的了,直接看数据,清洗,取自己想要的信息。
# 数据来源:链接网 采集工具:后羿采集器
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings("ignore")
total_path = r'D:\Python_Efficiency\sources\202003及05广州房价数据_后羿采集器'
lendhouse_path = total_path+r'\20200530广州租房房源_链家_后羿采集器.xlsx'
salehouse_path = total_path+r'\20200530广州二手房房源_链家_后羿采集器.xlsx'
lendhouse = pd.read_excel(lendhouse_path)
salehouse = pd.read_excel(salehouse_path)
print(lendhouse.info())
print("\n")
print(salehouse.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3003 entries, 0 to 3002
Data columns (total 8 columns):
标题 3003 non-null object
标题链接 3003 non-null object
缩略图 597 non-null object
content__list--item--des 3003 non-null object
content__list--item--time 3003 non-null object
content__list--item-price 3003 non-null object
oneline 2999 non-null object
brand 1763 non-null object
dtypes: object(8)
memory usage: 187.8+ KB
None<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3000 entries, 0 to 2999
Data columns (total 9 columns):
标题 3000 non-null object
标题链接 3000 non-null object
缩略图 3000 non-null object
头像 2972 non-null object
positionInfo 3000 non-null object
houseInfo 3000 non-null object
followInfo 3000 non-null object
totalPrice 3000 non-null object
unitPrice 3000 non-null object
dtypes: object(9)
memory usage: 211.1+ KB
None
lendhouse.head(1)
标题 | 标题链接 | 缩略图 | content__list--item--des | content__list--item--time | content__list--item-price | oneline | brand | |
---|---|---|---|---|---|---|---|---|
0 | 整租·万科里享家 3室2厅 南 | https://gz.lianjia.com/zufang/GZ25317298584640... | https://image1.ljcdn.com/110000-inspection/e49... | 黄埔-科学城-万科里享家\n /\n 78㎡\n ... | 2天前维护 | 2200 元/月 | 2天前维护 | NaN |
salehouse.head(1)
标题 | 标题链接 | 缩略图 | 头像 | positionInfo | houseInfo | followInfo | totalPrice | unitPrice | |
---|---|---|---|---|---|---|---|---|---|
0 | 地铁口 锦绣天伦花园 精致小三房 南向 视野开阔 | https://gz.lianjia.com/ershoufang/108400852116... | https://s1.ljcdn.com/feroot/pc/asset/img/blank... | https://s1.ljcdn.com/feroot/pc/asset/img/vr/vr... | 锦绣天伦花园 - 新塘北 | 3室2厅 | 90.58平米 | 南 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼 | 63人关注 / 5个月以前发布 | 178万 | 单价19652元/平米 |
print(lendhouse.columns)
print(salehouse.columns)
Index(['标题', '标题链接', '缩略图', 'content__list--item--des','content__list--item--time', 'content__list--item-price', 'oneline','brand'],dtype='object')
Index(['标题', '标题链接', '缩略图', '头像', 'positionInfo', 'houseInfo', 'followInfo','totalPrice', 'unitPrice'],dtype='object')
lendhouse.drop(['标题链接', '缩略图', 'content__list--item--time','oneline'], axis=1, inplace=True)
salehouse.drop(['标题链接', '缩略图', '头像'], axis=1, inplace=True)print(lendhouse.columns)
print("\n")
print(salehouse.columns)
Index(['标题', 'content__list--item--des', 'content__list--item-price', 'brand'], dtype='object')Index(['标题', 'positionInfo', 'houseInfo', 'followInfo', 'totalPrice','unitPrice'],dtype='object')
lendhouse.head()
标题 | content__list--item--des | content__list--item-price | brand | |
---|---|---|---|---|
0 | 整租·万科里享家 3室2厅 南 | 黄埔-科学城-万科里享家\n /\n 78㎡\n ... | 2200 元/月 | NaN |
1 | 合租·沙湾新村 4居室 南卧 | 黄埔-科学城-沙湾新村\n /\n 18㎡\n /... | 1000 元/月 | 安屋 |
2 | 整租·雅苑青年公馆 1室1厅 北 | 番禺-石碁-雅苑青年公馆\n /\n 61㎡\n ... | 1580 元/月 | 链家 |
3 | 独栋·魔尔公寓 魔尔公寓广州华侨新村店 精装套房可短租 1室1厅 | 仅剩4间\n /\n 56㎡\n ... | 4000-5500 元/月 | 魔尔公寓 |
4 | 整租·华景新城绿茵居 2室1厅 南 | 天河-华景新城-华景新城绿茵居\n /\n 62㎡\n ... | 2200 元/月 | NaN |
lendhouse.iloc[:,[1]]
content__list--item--des | |
---|---|
0 | 黄埔-科学城-万科里享家\n /\n 78㎡\n ... |
1 | 黄埔-科学城-沙湾新村\n /\n 18㎡\n /... |
2 | 番禺-石碁-雅苑青年公馆\n /\n 61㎡\n ... |
3 | 仅剩4间\n /\n 56㎡\n ... |
4 | 天河-华景新城-华景新城绿茵居\n /\n 62㎡\n ... |
... | ... |
2998 | 天河-华景新城-华景新城芳满庭园\n /\n 7㎡\n ... |
2999 | 番禺-市桥-西城花园\n /\n 96㎡\n /南... |
3000 | 越秀-东风东-梅花村\n /\n 11㎡\n /南... |
3001 | 番禺-雅居乐-广州雅居乐花园雅悦庭\n /\n 10㎡\n ... |
3002 | 天河-林和-林和邨\n /\n 60㎡\n /南 ... |
3003 rows × 1 columns
# lendhouse.iloc[[0],[1]] # 看不全单元格内的文字,只能看到这:黄埔-科学城-万科里享家\n /\n 78㎡\n ...
# lendhouse.iloc[[1],[1]] # 看不全单元格内的文字,只能看到这:黄埔-科学城-沙湾新村\n /\n 18㎡\n /...lendhouse.ix[[1]].values[0][1]
# 第二行第二列的值,全部内容是:'黄埔-科学城-沙湾新村\n /\n 18㎡\n /南 /\n 4室2厅2卫 \n /\n 低楼层 (16层)'
'黄埔-科学城-沙湾新村\n /\n 18㎡\n /南 /\n 4室2厅2卫 \n /\n 低楼层 (16层)'
salehouse.head()
标题 | positionInfo | houseInfo | followInfo | totalPrice | unitPrice | |
---|---|---|---|---|---|---|
0 | 地铁口 锦绣天伦花园 精致小三房 南向 视野开阔 | 锦绣天伦花园 - 新塘北 | 3室2厅 | 90.58平米 | 南 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼 | 63人关注 / 5个月以前发布 | 178万 | 单价19652元/平米 |
1 | 恒大山水城南向3房,位置好。总价低 | 恒大山水城 - 中新镇 | 3室2厅 | 99平米 | 东南 | 精装 | 高楼层(共18层) | 2008年建 | 板塔结合 | 421人关注 / 7个月以前发布 | 135万 | 单价13637元/平米 |
2 | 此房过五年 东西向方正实用 交通方便 小区安静 | 五羊小区 - 五羊新城 | 1室1厅 | 36.09平米 | 东 | 简装 | 低楼层(共9层) | 塔楼 | 22人关注 / 25天以前发布 | 188万 | 单价52092元/平米 |
3 | 精装电梯三房 南北双阳台 直接望蕉门河 | 龙光棕榈水岸北区 - 南沙区府 | 3室2厅 | 95.21平米 | 东南 | 精装 | 高楼层(共11层) | 2012年建 ... | 109人关注 / 1个月以前发布 | 238万 | 单价24998元/平米 |
4 | 心悦阁小区,两房,低楼层,北向单位 | 心悦阁 - 芳村 | 2室1厅 | 60.45平米 | 北 | 精装 | 低楼层(共9层) | 2005年建 | 塔楼 | 23人关注 / 9天以前发布 | 185万 | 单价30604元/平米 |
'''
由上,如果我们要对比租售比情况,可取二者共同信息是:
salehouse:所在区域-板块(eg番禺-新塘北)、小区名称(eg锦绣天伦花园)、大小(eg 90.58平米)、楼龄(eg 2015年建)、总价(eg 178万)、均价(eg 19652元/平米)
lendhouse:所在区域-板块(eg黄埔-科学城)、小区名称(eg沙湾新村)、大小(eg 18㎡)、月租金(1000 元/月)
同时,lendhouse租房需考虑:租赁方式(整租or合租)最后,我们通过数据清洗和合并,需要得到的,应该是:
同个小区:每平米售房价格/每平米租赁价格。可以加上“楼龄”“区域”“板块”分组分层。
'''
# 好好的周日下午,阳台外下起了淅淅沥沥的,大雨。先刷CBAP去了,未完待续。——2020.5.31,以上耗时,约摸1小时。
后面转中篇:
《houseprice_analysis_广州房子租售比分析(中)》https://blog.csdn.net/weixin_44216391/article/details/107633831
houseprice_analysis_广州房子租售比分析(上)相关推荐
- Linux驱动修炼之道-SPI驱动框架源码分析(上)
Linux驱动修炼之道-SPI驱动框架源码分析(上) SPI协议是一种同步的串行数据连接标准,由摩托罗拉公司命名,可工作于全双工模式.相关通讯设备可工作于m/s模式.主设备发起数据帧,允许多个从设 ...
- 08.零售类公司分析•上
08.零售类公司分析•上 1.零售公司赚钱的原理 用行业内公司相互对比是最有效的分析方式,通过相互对比,我们可以一目了然的看出哪家公司更好,更能赚钱.零售公司的分析,分为两部分. 首先是比对行业内,然 ...
- Windows日志分析(上)
Windows日志分析(上) 在我们Blue Team,针对Windows日志分析的场景占绝大多数,Windows 事件日志记录提供了源.用户名.计算机.事件类型和级别等详细信息,并显示应用程序和系统 ...
- 简要讨论python对于1688的关键字搜索、商品详情在电商运营大数据分析、电商选品、竞品分析上的帮助
目录 1688商品详情简要描述 1688商品详情请求URL 请求方式 参数 关键信息 淘宝天猫以及1688.京东.拼多多平台不断地在改变人们的消费习惯,人们从传统购物模式不断走向线上模式,作为电商行业 ...
- 光纤光谱仪在气体成分分析上应用
光纤光谱仪(http://www.microimaging.com.cn/gqgpy/)通过观测红外.可见光等波段光强度的技术,来分析和测量产品.我们可以利用这款产品在多个不同的领域进行使用,像是一些 ...
- SCIM输入法架构分析(上)
SCIM输入法架构分析(上) 转载时请注明出处:http://blog.csdn.net/absurd/ 文档格式与术语说明 1. 概述 SCIM是Smart Common Input Me ...
- 2020-09-02---三七互娱广州Java平台工程师线上笔试总结
三七互娱广州Java平台工程师线上笔试总结 一.第一部分逻辑选择题 该题型为推断题,找规律 题量为35题,时间为25分钟 举例一个简单的: 也就前几个是这个难度的,后面的难度越来越大,我做了20多个然 ...
- SCIM输入法架构分析 上
分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! SCIM ...
- SCIM输入法架构分析 上)
SCIM输入法架构分析(上) 转载时请注明出处:http://blog.csdn.net/absurd/ 文档格式与术语说明 1. 概述 SCIM是Smart Common Input Me ...
- 【实战】——基于机器学习回归模型对广州二手房价格进行分析及模型评估
目录 1.数据导入 2.数据清洗 2.1.变量选取 2.2.空值处理 2.3.类型转化 2.4.数据再处理 3.机器学习sklearn的实现 3.1.训练集和测试集的拆分 3.2.数据的标准化 3.3 ...
最新文章
- Modern Control
- Node.js + Nginx-现在怎么办?
- html图片上下左右滑动,一个支持任意尺寸的图片上下左右滑动效果
- 75. CPU 100%运行实战案例分析
- aop 获取注解注释的方法_带有AOP和注释的Java方法记录
- 产品认知:产品经理如何锻炼产品思维?
- 04.MyBatis别名的设置和类型转换器
- Servlet - 基础
- xampp安装后无法启动apache
- Kotlin 势必取代 Java?
- git解决 remote: Permission to wuheng1991/site-manager.git denied to XXX
- 5G协议流程-UE初始接入、F1启动小区激活
- mysql分割字符串_mysql分割字符串
- 4g网卡MF831移植到smart210
- 什么是为AI另辟蹊径的“小”数据?
- a标签实现下载图片功能
- transition 属性
- MTK平台TP驱动详解
- (4.5.5.6)Espresso的进阶: IdlingResource
- app 的 icon图标 有黑边