2020.5.31
在XXX等多重因素作用下,作为一棵跨了个行还未走上正轨的小韭菜瑟瑟发抖。
虽然,城市产业链是变化的,JJ重心和JY情况也是动态的:
我无法准确预测某个小区某个板块在未来3年、5年、10年甚至更久,是否还一如既往地繁荣,房子的价值是否一如既往地坚挺,那,就先看看当下,当下的其中一个因素——租售比。

原文提示zz原因审核不通过,那就直接附知乎链接了:
https://zhuanlan.zhihu.com/p/144897449


如果要追溯历史,从全球各国城镇化历史进程来对比分析判断一个城市经济产业、房价等要素的发展轨迹,
那,应该再获取到全球各个城市(尤其一二线城市)过去两百年的动态变化数据,包括各个重要阶段发生的重要事件等信息,多方面考量。
只是,作为一只小萌新,还没这么强大的功力,那就先搞个当下的租售比,粗略看看情况。

"""
"""
# 不写多的了,直接看数据,清洗,取自己想要的信息。
# 数据来源:链接网   采集工具:后羿采集器
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings("ignore")
total_path = r'D:\Python_Efficiency\sources\202003及05广州房价数据_后羿采集器'
lendhouse_path = total_path+r'\20200530广州租房房源_链家_后羿采集器.xlsx'
salehouse_path = total_path+r'\20200530广州二手房房源_链家_后羿采集器.xlsx'
lendhouse = pd.read_excel(lendhouse_path)
salehouse = pd.read_excel(salehouse_path)
print(lendhouse.info())
print("\n")
print(salehouse.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3003 entries, 0 to 3002
Data columns (total 8 columns):
标题                           3003 non-null object
标题链接                         3003 non-null object
缩略图                          597 non-null object
content__list--item--des     3003 non-null object
content__list--item--time    3003 non-null object
content__list--item-price    3003 non-null object
oneline                      2999 non-null object
brand                        1763 non-null object
dtypes: object(8)
memory usage: 187.8+ KB
None<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3000 entries, 0 to 2999
Data columns (total 9 columns):
标题              3000 non-null object
标题链接            3000 non-null object
缩略图             3000 non-null object
头像              2972 non-null object
positionInfo    3000 non-null object
houseInfo       3000 non-null object
followInfo      3000 non-null object
totalPrice      3000 non-null object
unitPrice       3000 non-null object
dtypes: object(9)
memory usage: 211.1+ KB
None
lendhouse.head(1)
标题 标题链接 缩略图 content__list--item--des content__list--item--time content__list--item-price oneline brand
0 整租·万科里享家 3室2厅 南 https://gz.lianjia.com/zufang/GZ25317298584640... https://image1.ljcdn.com/110000-inspection/e49... 黄埔-科学城-万科里享家\n /\n 78㎡\n ... 2天前维护 2200 元/月 2天前维护 NaN
salehouse.head(1)
标题 标题链接 缩略图 头像 positionInfo houseInfo followInfo totalPrice unitPrice
0 地铁口 锦绣天伦花园 精致小三房 南向 视野开阔 https://gz.lianjia.com/ershoufang/108400852116... https://s1.ljcdn.com/feroot/pc/asset/img/blank... https://s1.ljcdn.com/feroot/pc/asset/img/vr/vr... 锦绣天伦花园 - 新塘北 3室2厅 | 90.58平米 | 南 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼 63人关注 / 5个月以前发布 178万 单价19652元/平米
print(lendhouse.columns)
print(salehouse.columns)
Index(['标题', '标题链接', '缩略图', 'content__list--item--des','content__list--item--time', 'content__list--item-price', 'oneline','brand'],dtype='object')
Index(['标题', '标题链接', '缩略图', '头像', 'positionInfo', 'houseInfo', 'followInfo','totalPrice', 'unitPrice'],dtype='object')
lendhouse.drop(['标题链接', '缩略图', 'content__list--item--time','oneline'], axis=1, inplace=True)
salehouse.drop(['标题链接', '缩略图', '头像'], axis=1, inplace=True)print(lendhouse.columns)
print("\n")
print(salehouse.columns)
Index(['标题', 'content__list--item--des', 'content__list--item-price', 'brand'], dtype='object')Index(['标题', 'positionInfo', 'houseInfo', 'followInfo', 'totalPrice','unitPrice'],dtype='object')
lendhouse.head()
标题 content__list--item--des content__list--item-price brand
0 整租·万科里享家 3室2厅 南 黄埔-科学城-万科里享家\n /\n 78㎡\n ... 2200 元/月 NaN
1 合租·沙湾新村 4居室 南卧 黄埔-科学城-沙湾新村\n /\n 18㎡\n /... 1000 元/月 安屋
2 整租·雅苑青年公馆 1室1厅 北 番禺-石碁-雅苑青年公馆\n /\n 61㎡\n ... 1580 元/月 链家
3 独栋·魔尔公寓 魔尔公寓广州华侨新村店 精装套房可短租 1室1厅 仅剩4间\n /\n 56㎡\n ... 4000-5500 元/月 魔尔公寓
4 整租·华景新城绿茵居 2室1厅 南 天河-华景新城-华景新城绿茵居\n /\n 62㎡\n ... 2200 元/月 NaN
lendhouse.iloc[:,[1]]
content__list--item--des
0 黄埔-科学城-万科里享家\n /\n 78㎡\n ...
1 黄埔-科学城-沙湾新村\n /\n 18㎡\n /...
2 番禺-石碁-雅苑青年公馆\n /\n 61㎡\n ...
3 仅剩4间\n /\n 56㎡\n ...
4 天河-华景新城-华景新城绿茵居\n /\n 62㎡\n ...
... ...
2998 天河-华景新城-华景新城芳满庭园\n /\n 7㎡\n ...
2999 番禺-市桥-西城花园\n /\n 96㎡\n /南...
3000 越秀-东风东-梅花村\n /\n 11㎡\n /南...
3001 番禺-雅居乐-广州雅居乐花园雅悦庭\n /\n 10㎡\n ...
3002 天河-林和-林和邨\n /\n 60㎡\n /南 ...

3003 rows × 1 columns

# lendhouse.iloc[[0],[1]]  # 看不全单元格内的文字,只能看到这:黄埔-科学城-万科里享家\n /\n 78㎡\n ...
# lendhouse.iloc[[1],[1]]  # 看不全单元格内的文字,只能看到这:黄埔-科学城-沙湾新村\n /\n 18㎡\n /...lendhouse.ix[[1]].values[0][1]
# 第二行第二列的值,全部内容是:'黄埔-科学城-沙湾新村\n        /\n        18㎡\n        /南        /\n          4室2厅2卫        \n          /\n          低楼层                        (16层)'
'黄埔-科学城-沙湾新村\n        /\n        18㎡\n        /南        /\n          4室2厅2卫        \n          /\n          低楼层                        (16层)'
salehouse.head()
标题 positionInfo houseInfo followInfo totalPrice unitPrice
0 地铁口 锦绣天伦花园 精致小三房 南向 视野开阔 锦绣天伦花园 - 新塘北 3室2厅 | 90.58平米 | 南 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼 63人关注 / 5个月以前发布 178万 单价19652元/平米
1 恒大山水城南向3房,位置好。总价低 恒大山水城 - 中新镇 3室2厅 | 99平米 | 东南 | 精装 | 高楼层(共18层) | 2008年建 | 板塔结合 421人关注 / 7个月以前发布 135万 单价13637元/平米
2 此房过五年 东西向方正实用 交通方便 小区安静 五羊小区 - 五羊新城 1室1厅 | 36.09平米 | 东 | 简装 | 低楼层(共9层) | 塔楼 22人关注 / 25天以前发布 188万 单价52092元/平米
3 精装电梯三房 南北双阳台 直接望蕉门河 龙光棕榈水岸北区 - 南沙区府 3室2厅 | 95.21平米 | 东南 | 精装 | 高楼层(共11层) | 2012年建 ... 109人关注 / 1个月以前发布 238万 单价24998元/平米
4 心悦阁小区,两房,低楼层,北向单位 心悦阁 - 芳村 2室1厅 | 60.45平米 | 北 | 精装 | 低楼层(共9层) | 2005年建 | 塔楼 23人关注 / 9天以前发布 185万 单价30604元/平米
'''
由上,如果我们要对比租售比情况,可取二者共同信息是:
salehouse:所在区域-板块(eg番禺-新塘北)、小区名称(eg锦绣天伦花园)、大小(eg 90.58平米)、楼龄(eg 2015年建)、总价(eg 178万)、均价(eg 19652元/平米)
lendhouse:所在区域-板块(eg黄埔-科学城)、小区名称(eg沙湾新村)、大小(eg 18㎡)、月租金(1000 元/月)
同时,lendhouse租房需考虑:租赁方式(整租or合租)最后,我们通过数据清洗和合并,需要得到的,应该是:
同个小区:每平米售房价格/每平米租赁价格。可以加上“楼龄”“区域”“板块”分组分层。
'''
# 好好的周日下午,阳台外下起了淅淅沥沥的,大雨。先刷CBAP去了,未完待续。——2020.5.31,以上耗时,约摸1小时。

后面转中篇:
《houseprice_analysis_广州房子租售比分析(中)》https://blog.csdn.net/weixin_44216391/article/details/107633831

houseprice_analysis_广州房子租售比分析(上)相关推荐

  1. Linux驱动修炼之道-SPI驱动框架源码分析(上)

    Linux驱动修炼之道-SPI驱动框架源码分析(上)   SPI协议是一种同步的串行数据连接标准,由摩托罗拉公司命名,可工作于全双工模式.相关通讯设备可工作于m/s模式.主设备发起数据帧,允许多个从设 ...

  2. 08.零售类公司分析•上

    08.零售类公司分析•上 1.零售公司赚钱的原理 用行业内公司相互对比是最有效的分析方式,通过相互对比,我们可以一目了然的看出哪家公司更好,更能赚钱.零售公司的分析,分为两部分. 首先是比对行业内,然 ...

  3. Windows日志分析(上)

    Windows日志分析(上) 在我们Blue Team,针对Windows日志分析的场景占绝大多数,Windows 事件日志记录提供了源.用户名.计算机.事件类型和级别等详细信息,并显示应用程序和系统 ...

  4. 简要讨论python对于1688的关键字搜索、商品详情在电商运营大数据分析、电商选品、竞品分析上的帮助

    目录 1688商品详情简要描述 1688商品详情请求URL 请求方式 参数 关键信息 淘宝天猫以及1688.京东.拼多多平台不断地在改变人们的消费习惯,人们从传统购物模式不断走向线上模式,作为电商行业 ...

  5. 光纤光谱仪在气体成分分析上应用

    光纤光谱仪(http://www.microimaging.com.cn/gqgpy/)通过观测红外.可见光等波段光强度的技术,来分析和测量产品.我们可以利用这款产品在多个不同的领域进行使用,像是一些 ...

  6. SCIM输入法架构分析(上)

    SCIM输入法架构分析(上) 转载时请注明出处:http://blog.csdn.net/absurd/ 文档格式与术语说明 1.      概述 SCIM是Smart Common Input Me ...

  7. 2020-09-02---三七互娱广州Java平台工程师线上笔试总结

    三七互娱广州Java平台工程师线上笔试总结 一.第一部分逻辑选择题 该题型为推断题,找规律 题量为35题,时间为25分钟 举例一个简单的: 也就前几个是这个难度的,后面的难度越来越大,我做了20多个然 ...

  8. SCIM输入法架构分析 上

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! SCIM ...

  9. SCIM输入法架构分析 上)

    SCIM输入法架构分析(上) 转载时请注明出处:http://blog.csdn.net/absurd/ 文档格式与术语说明 1.      概述 SCIM是Smart Common Input Me ...

  10. 【实战】——基于机器学习回归模型对广州二手房价格进行分析及模型评估

    目录 1.数据导入 2.数据清洗 2.1.变量选取 2.2.空值处理 2.3.类型转化 2.4.数据再处理 3.机器学习sklearn的实现 3.1.训练集和测试集的拆分 3.2.数据的标准化 3.3 ...

最新文章

  1. Modern Control
  2. Node.js + Nginx-现在怎么办?
  3. html图片上下左右滑动,一个支持任意尺寸的图片上下左右滑动效果
  4. 75. CPU 100%运行实战案例分析
  5. aop 获取注解注释的方法_带有AOP和注释的Java方法记录
  6. 产品认知:产品经理如何锻炼产品思维?
  7. 04.MyBatis别名的设置和类型转换器
  8. Servlet - 基础
  9. xampp安装后无法启动apache
  10. Kotlin 势必取代 Java?
  11. git解决 remote: Permission to wuheng1991/site-manager.git denied to XXX
  12. 5G协议流程-UE初始接入、F1启动小区激活
  13. mysql分割字符串_mysql分割字符串
  14. 4g网卡MF831移植到smart210
  15. 什么是为AI另辟蹊径的“小”数据?
  16. a标签实现下载图片功能
  17. transition 属性
  18. MTK平台TP驱动详解
  19. (4.5.5.6)Espresso的进阶: IdlingResource
  20. app 的 icon图标 有黑边

热门文章

  1. UNIX编程艺术学习笔记-1
  2. Epic Games Launcher 无效驱动器E
  3. QQ空间的汉字转拼音代码
  4. android 表情变小了,别羡慕了!安卓微信表情包上限也变成999了!
  5. 论文投稿指南——计算机领域核心期刊
  6. 腾讯QQ珊瑚虫外挂原理分析
  7. SQL Server 2008 R2
  8. php5.6 手册,php5.6手册下载
  9. lg v35 thinkq刷韩版android9.0教程
  10. 瑞星2008序列号正确号码