SQL实战:上海二手房价分析
数据来源可见我的上篇博文Python数据分析实战:上海二手房价分析。将CSV文件中的数据导入到Navicat中,导入过程中需选择“10008(MAC-Simplified Chinese GB 2312)”这个编码格式,否则会出现乱码。
导入成功,如下所示。
需要将area、price这两列数据类型改为decimal
1 查询各区房价基本信息
SELECT addr_dist AS 区, SUBSTRING(AVG(price) FROM 1 FOR 5) AS 平均房价,
MAX(price) AS 最贵房价, MIN(price) AS 最低房价, COUNT(f1) AS 房源数量
FROM house_info
GROUP BY addr_dist
ORDER BY AVG(price) DESC
浦东的最高房价和最低房价高低悬殊
2 查询各区不同朝向的平均房价
SELECT addr_dist, face AS 朝向, AVG(price) AS 平均房价
FROM house_info
WHERE face IN ('南','南北')
GROUP BY addr_dist, face
ORDER BY addr_dist;
部分查询结果如上,结果显示起来很长,因此使用以下查询语言,使得查询结果美观点。
SELECT A1.addr_dist AS 区, 南朝向的平均房价, 南北朝向的平均房价
FROM
(SELECT addr_dist, SUBSTRING(AVG(price),1,5) AS 南朝向的平均房价
FROM house_info
WHERE face = '南'
GROUP BY addr_dist, face) AS A1
INNER JOIN
(SELECT addr_dist, SUBSTRING(AVG(price),1,5) AS 南北朝向的平均房价
FROM house_info
WHERE face = '南北'
GROUP BY addr_dist, face) AS A2
ON A1.addr_dist = A2.addr_dist
3 查询各区不同户型的平均房价
SELECT A1.addr_dist AS 区, 1室1厅1卫, 2室1厅1卫, 2室2厅1卫, 3室2厅1卫, 3室2厅2卫
FROM
(SELECT addr_dist, SUBSTRING(AVG(price),1,5) AS 1室1厅1卫
FROM house_info
WHERE type = '1室1厅1卫'
GROUP BY addr_dist, type) AS A1
INNER JOIN
(SELECT addr_dist, SUBSTRING(AVG(price),1,5) AS 2室1厅1卫
FROM house_info
WHERE type = '2室1厅1卫'
GROUP BY addr_dist, type) AS A2
ON A1.addr_dist = A2.addr_dist
INNER JOIN
(SELECT addr_dist, SUBSTRING(AVG(price),1,5) AS 2室2厅1卫
FROM house_info
WHERE type = '2室2厅1卫'
GROUP BY addr_dist, type) AS A3
ON A1.addr_dist = A3.addr_dist
INNER JOIN
(SELECT addr_dist, SUBSTRING(AVG(price),1,5) AS 3室2厅1卫
FROM house_info
WHERE type = '3室2厅1卫'
GROUP BY addr_dist, type) AS A4
ON A1.addr_dist = A4.addr_dist
INNER JOIN
(SELECT addr_dist, SUBSTRING(AVG(price),1,5) AS 3室2厅2卫
FROM house_info
WHERE type = '3室2厅2卫'
GROUP BY addr_dist, type) AS A5
ON A1.addr_dist = A5.addr_dist
SQL实战:上海二手房价分析相关推荐
- Python数据分析实战:上海二手房价分析
1 数据搜集 使用 urllib 库中的request 模块爬取赶集网发布的上海二手房信息,包括包括户型.面积.单价等,再使用BeautifulSoup 库解析爬取的HTML数据,最终将数据保存到CS ...
- 数据分析项目——深圳二手房价分析及价格预测
目录 一.需求说明 1.1基本任务 1.2 任务目的 1.3测试数据 二.概要设计说明 三.详细设计 3.1 数据检测模块 3.2 因变量分析模块 3.3 自变量分析模块 3.4 可视化模块 3.5 ...
- python建筑案例_Python数据分析实战-链家北京二手房价分析
前言 最近在自学Python,通过学习大家的分享案例,看到使用Python进行较多的主要4个方面:爬虫,数据处理,数据可视化以及机器学习建模.对我来说目标就是: 熟练使用numpy pandas 进行 ...
- 广州二手房价分析与预测
一.概述 1.1问题介绍与分析 随着社会经济的迅猛发展,房地产开发建设的速度越来越快,二手房市场迅猛发展,对二手房房产价格评估的需求也随之增大.因此,对二手房房价预测与分析是必要的.详细文档与代码 ...
- 武汉二手房价分析(原创分析,数据现势性2018年6月)
摘要:自编爬虫从某二手房交易网爬取武汉市全市13个区范围内6月份所有挂牌二手房交易信息,包括房屋所在小区名称.房间数.单价.总价.所属区域等,存储在表格中:根据小区名称和所属区域从高德网络地图API获 ...
- 深圳二手房房价分析及预测
分析目标: 通过处理后的房价数据,筛选对房价有显著影响的特征变量. 确定特征变量,建立深圳房价预测模型并对假设情景进行模拟 数据预处理 import pandas as pd import os fi ...
- Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测
Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测 目录 利用bs4和requests爬取了国内顶级某房源平 ...
- 爬虫系列(1):极简爬虫——基于requests和re爬取安居客上海二手房价数据
爬虫系列(1):极简爬虫--基于requests和re爬取安居客上海二手房价数据 入坑爬虫已经有一年多,一直想好好记录下从各位前辈和大佬处学到的技术,因此开了一个爬虫系列,想借此细致地介绍和演示其中的 ...
- Mysql高级调优篇——第三章:Sql实战调优场景剖析(上)
上几个章节我们讲述了很多硬核的知识,那本章开始我们正式进入Sql实战过程!! 1.热身Case 回顾上节讲的Explain知识点,我们简单做个回顾,来个热身的Case: 看下面的Sql执行是如何的,请 ...
最新文章
- python——初识python篇
- rocks自建存储流程
- spring boot同时启动多个服务副本(同一服务启动在不同端口)配置方法
- windows下VS2015配置caffe
- mysql使用sql语句查询数据库所有表注释已经表字段注释
- Java并发(三)——线程池
- JS String,Array
- 最新服务器处理器天梯,2019 最新 至强 Xeon E5 服务器系列 CPU天梯图
- 2018.6清北学堂day6上午
- (转)LRC歌词编辑攻略1
- 橙光游戏c语言代码,橙光游戏一
- 安全认证宇宙之用户认证0x01
- 企业微信怎么扫描名片加好友?企业微信名片如何统计好友添加情况?
- python print用法可以不加引号吗_python的print函数不加括号吗
- 计算机二级网上报名中北大学,2018年中北大学英语六级考试报名通知
- python成三棋源代码
- 创新杯说课大赛计算机ppt,全国创新杯说课大赛计算机应用基础类一等奖作品:图像的合成说课课件...
- Elastic search点点滴滴
- 阿里云PAI将神经机器翻译训练效率提升5倍
- 22_linux笔记-ssh服务