别再听中介忽悠了,用python找到最合适你的房子
为了确保换房后我和女友前往各自上班地点的通勤时间都在可接受范围内,我需要知道从各处房源位置前往两家公司所需的时间。为了获取这些信息,我们需要借助高德地图api这个工具。
使用高德api,我们能够轻松地根据地址或名称获取到地址对应的坐标位置,进而获取到对应地点的通勤和周边信息,十分的方便。
在使用api之前,我们首先需要获取到自己的Key值。进入高德开放平台网站,完成个人开发者注册和zfb实名认证后,点击 控制台
→ 应用管理
→ 我的应用
→ 创建新应用
,来完成应用的创建。
之后点击右上角的 添加
,来为自己创建一个Key,注意这里服务平台要选择 Web服务
,不同选项对应的服务范围是不同的。
创建key值之后,就可以开始使用api获取数据了。
首先我们要根据地点名称得到对应的坐标值,然后用出发地和目的地的坐标调用接口,得到两个位置之间的通勤时间。
思路理清之后,就到了操作时间了。
获取房源坐标
因为总的房源数量太大,所以我们可以用小区的坐标位置代替房源的具体位置进行调用,这样需要进行的处理量就大大减小了,可以节省一些不必要的成本。
因此首先我们对上篇文章中获取到的数据做一个简单的处理,利用set对小区名做一个去重。
csv_read=pd.read_csv('../document/sh.csv',header=None) village_set = set(csv_read[2]) village_list = list(village_set)
获取到小区列表后,我们尝试调用一下获取坐标的API。
# 高德API的URL geourl = 'https://restapi.amap.com/v3/geocode/geo' # 地址前要加地区名,否则可能定位到其他城市 params = {'key':'在这里填入个人的Key值','address': '上海市国金中心'} # 发送请求 res = requests.get(geourl, params) jd = json.loads(res.text) # 返回值的具体格式可以在API文档中查看 geopoint_1 = jd['geocodes'][0]['location']print(geopoint_1) # 121.502021,31.236814
调用成功之后,我们就可以用相同的方法,获取到列表中所有小区的坐标。
获取路程时间
在得到各个小区的坐标位置之后,我们就可以调用api获取两个坐标之间的路程时间了。
举个例子,如果我需要获取两个坐标之间的公交地铁通勤时间,可以用如下的方法:
# 高德API的URL puburl = 'https://restapi.amap.com/v3/direction/transit/integrated?origin={}&destination={}&key={}&time=9:00&city=上海' # 发送请求 r=requests.get(puburl.format(geopoint_1, geopoint_vill, '在这里填入个人的Key值')) r=r.text jsonData=json.loads(r) # 获取步行距离 publength = round(int(jsonData['route']['transits'][0]['walking_distance'])/1000, 2) # 获取总时间 pubtime = round(int(jsonData['route']['transits'][0]['duration'])/60)
这里一般会获取到多条路线,不过因为第一条路线通常是用时最短的,所以这里就以第一条路线的数据为代表。
用类似的方法,通过使用不同的url,就能获取到驾车、步行等方式的路程时间。不过要注意不同的这些api的输入和输出参数是有一定区别的,具体的要参照文档。
完整代码
import pandas as pd import requests import json import csv import codecs# 创建导出文件 with open(r'..\document\village.csv', 'wb+')as fp:fp.write(codecs.BOM_UTF8) f = open(r'..\document\village.csv','w+',newline='', encoding='utf-8') writer = csv.writer(f) writer.writerow(("小区名", "坐标", "步行距离-地点1","通勤时间-地点1", "步行距离-地点2","通勤时间-地点2"))geourl = 'https://restapi.amap.com/v3/geocode/geo' puburl = 'https://restapi.amap.com/v3/direction/transit/integrated?origin={}&destination={}&key={}&time=9:00&city=上海' # 读取文件 csv_read=pd.read_csv('../document/sh.csv',header=None) village_set = set(csv_read[2]) village_list = list(village_set)# 获取第一个坐标 geourl = 'https://restapi.amap.com/v3/geocode/geo' # 地址前要加地区名,否则可能定位到其他城市 params = {'key':'在这里填入个人的Key值','address': '上海市国金中心'} # 发送请求 res = requests.get(geourl, params) jd = json.loads(res.text) # 返回值的具体格式可以在API文档中查看 geopoint_1 = jd['geocodes'][0]['location']# 获取第二个坐标 params = {'key':'在这里填入个人的Key值','address': '上海市国正中心'} res = requests.get(geourl, params) jd = json.loads(res.text) geopoint_2 = jd['geocodes'][0]['location']for adr in village_list:# 获取小区坐标params = {'key':'在这里填入个人的Key值','address': '上海市'+adr} res = requests.get(geourl, params)jd = json.loads(res.text)geopoint = jd['geocodes'][0]['location']# 获取第一个位置的信息r=requests.get(puburl.format(geopoint_1, geopoint, '在这里填入个人的Key值')) r=r.text jsonData=json.loads(r)publength_1 = round(int(jsonData['route']['transits'][0]['walking_distance'])/1000, 2)pubtime_1 = round(int(jsonData['route']['transits'][0]['duration'])/60) # 获取第二个位置的信息r=requests.get(puburl.format(geopoint_2, geopoint, '在这里填入个人的Key值')) r=r.text jsonData=json.loads(r)publength_2 = round(int(jsonData['route']['transits'][0]['walking_distance'])/1000, 2)pubtime_2 = round(int(jsonData['route']['transits'][0]['duration'])/60) writer.writerow((adr, geopoint, publength_1, pubtime_1, publength_2, pubtime_2))f.close()
将脚本执行后,就能获得各个小区距离目标地点的路程时间。后面再经过一些简单的筛选,就能大大缩小找房的选择范围了。
高德API还有很多其他的功能,比如POI周边搜索可以查询小区周边指定范围内(比如方圆1公里)是否有便利店,健身房等设施,结合前端组件还可以在地图中显示出指定的位置,合理运用这些功能,能够实现更多的个性化需求,文中只用了很小一部分,大伙可以参照API文档自行尝试。
不过也要注意一点,对于个人开发者而言,高德API每日的调用次数是有限制的,为了避免超额,大家在爬取数据的时候可以根据实际情况适度缩小范围,减少处理的数据量。
以上就是这次找房故事的全部内容了,希望能对大家有所帮助,感谢阅读,也祝愿每个打工人都能住的舒心,早日有房。
别再听中介忽悠了,用python找到最合适你的房子相关推荐
- 蓝宝石会升级bios吗_别再听别人忽悠!升级BIOS的三大误区
别再听别人忽悠!升级BIOS的三大误区 2006年01月09日 08:06作者:整理自互联网编辑:孟忠孝 分享 误区一:主板BIOS升级之后,可使系统性能得到很大提升! 对于BIOS来说,并不是越新越 ...
- python房地产爬虫_房产中介网站爬虫实战(Python BS4+多线程)(一)
本系列文章介绍了爬取链家和搜房网(房天下)数据的方法. 房产中介网站爬虫实战(Python BS4+多线程)(一) 房产中介网站爬虫实战(Python BS4+多线程)(二) 房地产市场向来是大数据分 ...
- python中random库中shuffle_[宜配屋]听图阁 - 详解Python中打乱列表顺序random.shuffle()的使用方法...
之前自己一直使用random中 randint生成随机数以及使用for将列表中的数据遍历一次. 现在有个需求需要将列表的次序打乱,或者也可以这样理解: [需求]将一个容器中的数据每次随机逐个遍历一遍. ...
- NCEP再分析数据(FNL)Python下载
NCEP再分析数据(FNL)Python下载 楼主第一次接触WRF模型,最近在摸索该如何使用WRF和相关数据如何下载,简单记录一下. 数据网址: https://rda.ucar.edu/datase ...
- 周星驰:初听不知曲中意,再听已是曲中人
01 知乎中曾有这么一个回答吸引到我:很多人说年少时看<大话西游>,看着看着就笑了:长大之后再看,看着看着就哭了:但不管是笑了还是哭了,心中总有很多疑惑无法解开. 一谈起大话西游,大家都是 ...
- 月薪过万算中产吗?别听专家忽悠,算清这8本账:你这是骂我
有个热议:我年薪11万,可以算中产了吗?有砖家说,年薪11万,在大城市也算中产了.别听砖家的"大忽悠".中产标准,应该是以"个人追求"为标准,因人而异.年薪11 ...
- 初闻不知曲中意,再听已是曲终人!哪首歌让你,而立之年泪流满面
初闻不知曲中意,再听已是曲终人. 曲中思念今犹在,不见当年梦中人. 人们常说"年少不听李宗盛,听懂已是不惑年",其实有些歌曲初听并无感觉,只是多年之后,在街头巷尾响起前奏,就令人心 ...
- 刘若英唱《后来》失控大哭:初听不知曲中意,再听已是曲中人
最近,一组刘若英在演唱会现场演唱<后来>泪流满面的视频图片,引起了无数人的心疼.也许很多人都不知道她为何会泣不成声,但是我想应该有人会懂,因为每个人都会有念念不忘的一首歌,也许藏了一个人, ...
- 【听译大师说话】python 创始人访谈录2: python 的起源,特点和未来
perl 创始人和 python 创始人 听译这东西的确很累人,一次翻译太多也很疲惫. 我尽量想在一篇博客中包含尽量多的内容,结果最终搞的自己兴趣全无了,下次看来还是应该一点一点的来. 我的听力还是不 ...
最新文章
- Fabric 代码发布
- Object family 在Object search中的default逻辑
- mysql buffer 命中率_从MySQL的源码剖析Innodb buffer的命中率计算
- .NET对存储过程的调用抽象封装
- 手眼标定(eye in hand)-步骤
- 永恒之塔4.0单机MYSQL,永恒之塔数据库
- 关于图像客观质量评价
- 世界上第一台计算机论文,世界上公认的第一台电子计算机是1946年诞生。.doc
- 项目介绍之论文格式的自动检测与修改系统
- 提高科学研究素养的路径
- uni-app的安装及使用
- 汽车之家字体加密破解(CSS样式反爬)
- php蛇蛇大作战,贪吃蛇大作战
- [VOT12](2017CVPR) CSR-DCF: Discriminative Correlation Filter Tracker with Channel and Spatial
- 每个软件工程师都应该知道的有关实时数据的统一概念
- 开发SpringBoot+Jwt+Vue的前后端分离后台管理系统VueAdmin - 前端笔记
- revit模型旋转整个项目实际角度(非查看角度)
- Babylon.js实战WebXR/元宇宙
- #第26篇分享:一个文本分类的数据挖掘(python语言:sklearn 朴素贝叶斯NB)(2)
- sidirect 连接西门子_配置SIDirect DAServer 通过TCP/IP实现和西门子PLC的通信(1)-机电之家网PLC技术网...
热门文章
- 晨枫U盘启动盘之启动画面OEM
- FileZilla快速部署
- 中国移动明确5G商用时间表
- 什么是Serv-U,什么是servu,Serv-U,servu
- DELL 6248交换机常用配置示例
- 2190: 【USACO】Farmer John has no Large Brown Cow
- html提示用Safari浏览器打开,Safari浏览器无法打开网页怎么办 Safari打不开网站原因及解决方法...
- 用C语言写钢琴小程序的代码,用C语言编写钢琴小程序
- 智慧物联下主机加固安全解决方案分析
- C语言:递归实现N的阶乘