不管是目前什么行业,对数据分析和做出合适的判断才是最重要的选择,比如,在某一个城市开一家餐馆,可以去了解这个城市目前一共有多少餐馆,分别那种菜系占比最多,大概菜系的分布范围等等信息,都可以通过爬虫的数据获得更好的分析和抉择。

总结步骤如下:

到高德开放平台 | 高德地图API注册账号,并且申请web服务的AK密钥,每次发送请求需要带着这个key去认证。注册账号登陆后点击右上角的控制台 ->应用管理 -> 创建应用 -> 添加新key,注意选择web api,就得到了一个可以使用web服务的key密钥。

查找高德地图提供的web api下的搜索模块使用API文档开发指南

http://lbs.amap.com/api/webservice/guide/api/search

之前本人试过通过高德地图中的搜索页面搜索功能,不输入key,但是访问次数有一定的限制,就会让输入拼图验证

这种方法不可取只能去注册key,然后去获得需要的数据

关于高德地图信息抓取,我们根据高德地图搜索POI文档 ,简单的说下两种比较实用的方法

第一种  多边形搜索

多边形搜索需要在地图上绘制经度和纬度用","分割,经度在前,纬度在后,坐标对用"|"分割。经纬度小数点后不得超过6位。         多边形为矩形时,可传入左上右下两顶点坐标对;其他情况下首尾坐标对需相同

示例:

如上图四个marker点,调用高德地图POI搜索功能即可搜索这个片区内的数据信息

测试接口:

https://restapi.amap.com/v3/place/polygon?polygon=108.875542,34.193769|108.880032,34.193724|108.880038,34.191466|108.875633,34.191399|108.875542,34.193769&key=

可传入keywords和types,当keywords和types为空的时候, 会默认指定types为120000(商务住宅)&150000(交通设施服务)

查询POI类型下载POI分类编码和城市编码表

https://lbs.amap.com/api/webservice/download

POI分类编码部分截图

由此可见,可以根据需要的菜系类型查找某一地区菜系的分布效果

返回数据格式:

名称含义规则说明

status

结果状态值,值为0或1

0:请求失败;1:请求成功

info

返回状态说明

status为0时,info返回错误原因,否则返回“OK”。详情参阅info状态表

count

搜索方案数目(最大值为1000)

suggestion

城市建议列表

当用户输入的词语为泛搜索词的时候,将显示城市列表

keywords

唯一ID

cities

城市列表

name

名称

num

该城市包含此关键字的个数

citycode

该城市的citycode

adcode

该城市的adcode

pois

搜索POI信息列表

poi

POI信息

id

唯一ID

parent

父POI的ID

当前POI如果有父POI,则返回父POI的ID。可能为空

name

名称

type

兴趣点类型

顺序为大类、中类、小类

例如:餐饮服务;中餐厅;特色/地方风味餐厅

typecode

兴趣点类型编码

例如:050118

biz_type

行业类型

address

地址

东四环中路189号百盛北门

location

经纬度

格式:X,Y

distance

离中心点距离

单位:米

必须说明, 此结果仅在周边搜索的时候有值

tel

该POI的电话

postcode

邮编

extensions=all的时候显示

website

该POI的网址

extensions=all的时候显示

email

该POI的电子邮箱

extensions=all的时候显示

pcode

poi所在省份编码

extensions=all的时候显示

pname

poi所在省份名称

若是直辖市的时候,此处直接显示市名,例如北京市

citycode

城市编码

extensions=all的时候显示

cityname

城市名

若是直辖市的时候,此处直接显示市名,例如北京市

adcode

区域编码

extensions=all的时候显示

adname

区域名称

区县级别的返回,例如朝阳区

entr_location

入口经纬度

extensions=all的时候显示

exit_location

出口经纬度

extensions=all的时候显示

navi_poiid

地图编号

extensions=all的时候显示

gridcode

地理格ID

extensions=all的时候显示

alias

别名

extensions=all的时候显示

business_area

所在商圈

extensions=all的时候显示

parking_type

停车场类型

仅在停车场类型POI的时候显示该字段

展示停车场类型,包括:地下、地面、路边

extensions=all的时候显示

tag

该POI的特色内容

主要出现在POI为美食类的POI之中出现,此时代表特色菜

例如“烤鱼,麻辣香锅,老干妈回锅肉”

在其余POI类别的时候,会有小概率出现,此时代表此POI的特色内容

例如北京-第五季花艺 之中的“岁月静好,定情,如意花卡,圣诞之爱”

仅在extensions=all

indoor_map

是否有室内地图标志

1,表示有室内相关数据

0,代表没有室内相关数据

extensions=all的时候显示

indoor_data

室内地图相关数据

当indoor_map=0时,字段为空

extensions=all的时候显示

cpid

当前POI的父级POI

如果当前POI为建筑物类POI,则cpid为自身POI ID;如果当前POI为商铺类POI,则cpid为其所在建筑物的POI ID

floor

楼层索引

一般会用数字表示,例如8

truefloor

所在楼层

一般会带有字母,例如F8

groupbuy_num

团购数据

此字段逐渐废弃

business_area

所属商圈

extensions=all的时候显示

discount_num

优惠信息数目

此字段逐渐废弃

biz_ext

深度信息

extensions=all的时候显示

rating

评分

仅存在于餐饮、酒店、景点、影院类POI之下

cost

人均消费

仅存在于餐饮、酒店、景点、影院类POI之下

meal_ordering

是否可订餐

仅存在于餐饮相关POI之下(此字段逐渐废弃)

seat_ordering

是否可选座

仅存在于影院相关POI之下(此字段逐渐废弃)

ticket_ordering

是否可订票

仅存在于景点相关POI之下(此字段逐渐废弃)

hotel_ordering

是否可以订房

仅存在于酒店相关POI之下(此字段逐渐废弃)

photos

照片相关信息

extensions=all的时候显示

titile

图片介绍

url

具体链接

弊端:

调用次数有限制,只有2000次免费调用次数,可以购买次数

第二种:关键字搜索

通过用POI的关键字进行条件搜索,例如:肯德基、朝阳公园等;同时支持设置POI类型搜索,例如:银行查询城市

可选值:城市中文、中文全拼、citycode、adcode

如:北京/beijing/010/110000

填入此参数后,会尽量优先返回此城市数据,但是不一定仅局限此城市结果,若仅需要某个城市数据请调用citylimit参数。

如:在深圳市搜天安门,返回北京天安门结果。

规则:只支持单个关键词语搜索关键词支持:行政区名称、citycode、adcode

例如,在subdistrict=2,搜索省份(例如山东),能够显示市(例如济南),区(例如历下区)

例子:

https://restapi.amap.com/v3/place/text?keywords=&city=610115000000&offset=20&page=1&key=

部分数据存储:

这两个方法的实现大致相同,只是请求不同的URL地址

python爬高德地图_【爬虫】Java关于高德地图爬取数据相关推荐

  1. Python 爬虫实战,模拟登陆爬取数据

    Python 爬虫实战,模拟登陆爬取数据 从0记录爬取某网站上的资源连接: 模拟登陆 爬取数据 保存到本地 结果演示: 源网站展示: 爬到的本地文件展示: 环境准备: python环境安装 略 安装r ...

  2. python爬虫项目描述怎么写_爬虫项目咋写,爬取什么样的数据可以作为项目写在简历上?...

    看样子,主要目的是上简历 如果你想要爬虫的offer,那么你的项目应该有这么几个特征: 能用常用的框架,必要时有能力修改框架甚至自己写一个 熟悉多线程多进程分布式等,对爬虫任务调度有很好的解决办法 采 ...

  3. python 山脊图_爬虫:带你一键爬取王者荣耀英雄皮肤壁纸

    一.前言 王者荣耀这款手游,想必大家都玩过或听过,游戏里英雄有各式各样的皮肤,制作得很精美,有些拿来做电脑壁纸它不香吗.本文带你利用Python爬虫一键下载王者荣耀英雄皮肤壁纸. 1. 目标 创建一个 ...

  4. python爬取携程网旅游_爬虫之携程网旅游信息爬取

    最近手又有点闲,闲着无聊就爬取了携程的信息,这个爬虫是我随手写的,各位可以看看. # -*- encoding=utf-8 -*- #爬取携程旅游信息 #2017/8/14 from bs4 impo ...

  5. 图片链接用src不能被爬虫爬到吗_爬虫:带你一键爬取王者荣耀英雄皮肤壁纸

    一.前言 王者荣耀这款手游,想必大家都玩过或听过,游戏里英雄有各式各样的皮肤,制作得很精美,有些拿来做电脑壁纸它不香吗.本文带你利用Python爬虫一键下载王者荣耀英雄皮肤壁纸. 1. 目标 创建一个 ...

  6. easyui datalist 不显示数据_爬虫练习——豆瓣电影信息爬取及数据可视化

    最近自学了简单的爬虫项目,简单记录下自己的小白学习路径. 本次爬取的是豆瓣电影TOP250数据,主要用到beautifulsoup.re.urllib库.SQLite包,数据可视化方面主要用到flas ...

  7. PYTHON爬虫神站——curl.trillworks 爬取数据只需两步!

    前不久作者因为需要爬取一些建筑类数据 于是又又又准备苦哈哈的打开百度搜索"如何爬取XX",然后看html,找到关键点再挨个循环访问.....以下省略. 但这次 这款朋友推荐网站拯救 ...

  8. python桌面爬虫_爬虫项目实战十三:爬取zol桌面壁纸

    目标 爬取zol桌面壁纸,批量下载图片. 项目准备 软件:Pycharm 第三方库:requests,fake_useragent,re,lxml 网站地址:http://desk.zol.com.c ...

  9. python爬取cctalk视频_新媒体编辑怎么批量爬取数据

    说到数据采集,市面上很多采集工具,有商业的也有开源的各种工具,一搜一大堆,做新媒体的好不容易找到一些资料内容甚至图片,手工粘贴复制有时候很慢,一点都不友好,有没有办法能帮助新媒体从业者快速采集到想要的 ...

  10. python前端图表框架_图表highcharts联合jquery ajax 后端取数据前端图表渲染

    Highcharts是一个制作图表的纯Javascript类库,主要特性如下:兼容性:兼容当今所有的浏览器,包括iPhone.IE和火狐等等: 对个人用户完全免费: 纯JS,无BS: 支持大部分的图表 ...

最新文章

  1. 黑客基础知识与防护(二)
  2. C#基础知识梳理系列十:异常处理 System.Exception
  3. P1642 规划 01分数规划+树形DP
  4. proDAD Erazr便携版
  5. BZOJ 3990: [SDOI2015]排序(搜索+剪枝)
  6. Visual Studio 2010 中的 SharePoint 开发
  7. win10 dns异常上不了网如何解决
  8. Centos7 安装Jdk1.8u172
  9. 阿里合伙人名单曝光;百度网盘回应“不买会员限速”;库克:不担心苹果在华表现 | 极客头条...
  10. mysql的权限管理
  11. 403保护网站服务器,HTML5服务器禁止访问403错误动画
  12. MATLAB数字水印技术实现
  13. 如何解决CDR绘图时出现的“毛边”瑕疵问题
  14. 基于股票数据的多元线性回归分析
  15. Linux之python版本升级
  16. 接口报错500是什么意思_500错误原因解决办法?错误页面怎么解决?到底是什么问题?...
  17. (3.6A)不用库函数实现字符串拼接
  18. 构建安全新模式,零信任如何破局 ?
  19. R语言GWR地理加权回归
  20. 除了Java,还可以培训学习哪些IT技术?

热门文章

  1. 苹果手机怎么下载铃声
  2. Opencv 学习笔记(二)
  3. CNCAP2021版 主动安全ADAS系统试验方法
  4. 城市引力模型——城市经济联系度制作
  5. 【Atheros】Ath9k速率调整算法源码走读
  6. HanLP中文分词、人名识别、地名识别
  7. 域名设置A记录或CNAME记录,但无法被解析,可能是因为状态为:clientHold
  8. 关于中国电信天翼开放平台短信接口的一些使用
  9. 【图文讲解】映射——单射-双射-满射概念
  10. 微信小程序开发VIP商城项目