目标:爬取阿克苏地区内的所有医院数据。

一、百度地图开放平台注册,获取到AK。
(1)在百度地图开放平台完成注册。
这个平台是百度地图为开发者提供接口用的,有很多其他的功能,这里只讲POI爬取相关。
(2)登陆百度地图开放平台后
点击“控制台”->“应用管理”->"我的应用“->“创建应用”

然后进行相关设置
1.注意是选择服务端还是浏览器端
比如接下来我的操作是在浏览器进行的,所以我选择浏览器端
2.根据自身需要,设置IP白名单,限制调用ak的电脑,若不限制就设置为0.0.0.0
3.提交

创建成功后就可以在”我的应用“中看到自己创建的ak了,把它复制下来。
【关于ak的说明,详细的可以看首页的开发文档——web服务API部分】

二、有关配额的问题。
对于大多数未认证用户,每天的配额是有限的,不能超过十万次,每分钟不能超过6千次。
在爬取POI上,用一次ak生成的URL页面只能显示20个兴趣点的信息,而一个坐标范围内,最多能生成20个URL页面,即一个坐标范围内,用ak生成的URL页面最多能爬取到400个兴趣点的信息。
如果一个坐标范围内的兴趣点不超过400个,那么一个坐标范围就够了,但是如果超过400个,那就不够用了,需要具体的划分坐标。

三、请求URL。
尝试把下面这个网址复制到浏览器
(http://api.map.baidu.com/place/v2/search?query=%E5%8C%BB%E9%99%A2&region=%E9%98%BF%E5%85%8B%E8%8B%8F%E5%9C%B0%E5%8C%BA&page_size=20&page_num=0&output=json&ak=9wDdjFgfFqN9dYvoYPEqK0oadGNb9ARw)
(ak换成你自己的ak)

可以看到这样一个页面:

这就是爬取到的其中一页阿克苏地区医院的信息。
将http://api.map.baidu.com/place/v2/search?query=医院&region=阿克苏地区&page_size=20&page_num=0&output=json&ak=9wDdjFgfFqN9dYvoYPEqK0oadGNb9ARw具体解释一下:
”query=医院” ——查询关键字是医院
”region=阿克苏地区“ ——查询地区是阿克苏地区
“page_size=20&page_num=0”——一共能生成20个URL页面,这个是第0个
【程序语言的排号,一般都是从0开始的,想看下一个就把page_num改为=1,以此类推】由于一页只能生成20个兴趣点,所以20个URL页面就是400个兴趣点。

从total这里可知道,搜索到的总共108个位置信息,小于400,所以不需要对坐标范围进一步划分。【大于400的情况有点麻烦,下回写吧】

“output=json”—— 以json格式来输出
“ak=9wDdjFgfFqN9dYvoYPEqK0oadGNb9ARw”—— ak是9wDdjFgfFqN9dYvoYPEqK0oadGNb9ARw(就是刚刚申请的ak)

所以如果想找其他地区的其他位置信息,就把对应的关键字修改了就Ok

然后把json转换为excel格式
可使用在线转换器TableConvert(百度搜索),注意格式就行,其他问题不大

使用百度地图POI爬取需要的数据相关推荐

  1. 百度地图POI数据爬取,突破百度地图API爬取数目“400条“的限制11。

    1.POI爬取方法说明 1.1AK申请 登录百度账号,在百度地图开发者平台的API控制台申请一个服务端的ak,主要用到的是Place API.检校方式可设置成IP白名单,IP直接设置成了0.0.0.0 ...

  2. python调用百度地图API爬取西安市POI数据

    任务前提 做该项目之前,首先得有基础知识: 编程语言:python 编译工具:PyCharm 网络爬虫相关知识,xpath库,numpy,pandas等库. 任务准备: 去百度地图开放平台申请密匙:h ...

  3. 百度地图API爬取不同类型POI的详细数据

    一.相关概念 查询某个范围内的所有POI 参数介绍: page_size:单次查询返回的POI的数量,最大值为20 page_num:查找的POI数量超过20时,会分页显示:比如60个POI就会分3页 ...

  4. 百度地图API爬取网吧

    # coding=utf-8 import urllib import json import sys import randomreload(sys) sys.setdefaultencoding( ...

  5. python交通调查数据处理_Python突破高德API限制爬取交通态势数据+GIS可视化(超详细)...

    一.需求: 爬取高德的交通态势API,将数据可视化为含有交通态势信息的矢量路网数据. 二.使用的工具: Python IDLE.记事本编辑器.ArcGIS 10.2.申请的高德开发者KEY(免费). ...

  6. Windows下利用python+selenium+firefox爬取动态网页数据(爬取东方财富网指数行情数据)

    由于之前用urlib和request发现只能获取静态网页数据,目前爬取动态网页有两种方法, (1)分析页面请求 (2)Selenium模拟浏览器行为(霸王硬上弓),本文讲的就是此方法 一.安装sele ...

  7. python爬取百度地图数据_百度地图POI数据爬取

    利用百度地图开发者中心中的web API获取城市POI数据,后期会写出完整的多种参数详细数据获取教程.本次只写出了根据关键词和目的地的数据获取程序. 将爬取下来的数据保存到本地csv文件. 百度API ...

  8. 利用百度地图api抓取POI点(上海公交站)

    1.功能描述 百度地图api抓取POI点(上海公交站) 2.代码 import pandas as pd import requests import json import numpy as npi ...

  9. 百度地图POI数据获取

    转载自:https://blog.csdn.net/baidu_26646129/article/details/80464447 本文主要介绍百度地图POI数据获取:从百度地图得到POI数据,以js ...

最新文章

  1. 如何构建一个理想UI代码表达的自动化工具?
  2. 13-Introduction to security
  3. [非旋平衡树]fhq_treap概念及模板,例题:普通平衡树,文艺线段树
  4. OpenResty+Lua+redis+mysql实现高性能高可用限流缓存
  5. 微型计算机10053拆装,微型计算机的程序设计概要1.ppt
  6. 基于汇编语言及Proteus仿真的CPU8086水库水位监视系统
  7. 【AcWing】103. 电影(离散化)
  8. 基于matlab的图像仿真研究,基于MATLAB的图像锐化算法研究与仿真
  9. java设计模式 观察者模式_JAVA设计模式之观察者模式
  10. Vissim安装及配置详解
  11. 明尼苏达员工满意度量表包括哪些内容?
  12. 2021计算机考试准考证打印入口(附官网网址)
  13. 叮咚小区官网新闻已不更新
  14. android app 唤醒屏幕
  15. EP21 Activity在非正常行为下的数据保存和恢复
  16. 揭秘2023年高新软件技术
  17. 魔兽世界:在网吧玩WOW,遇到很多旁观者(旁)
  18. 【北京-望京】这16家互联网公司值得你加入
  19. 什么是乐观锁和悲观锁
  20. 【软件简史】怎样理解 Alan Kay 曾在1984 年写道:“我们希望像以前编辑文档一样编辑我们的工具” 这句话 —— LLM 将如何影响软件的创建?

热门文章

  1. wps分析工具库如何加载_【数据分析】关键词数据分析如何做?用这个工具比指数好...
  2. 物体抓取位姿估計算法綜述_NO. 1 物体位姿估计 机器人抓取
  3. python编程练习:提取Visual MODFLOW水均衡数据(.ZOT)文件至表格
  4. 到底啥是分布式系统开发经验?
  5. 利用FPGA仿真软件modelsim仿真波形显示图片
  6. 【遇见Doris】Apache Doris 在京东广告平台的应用
  7. 马斯克打了个响指,推特50%员工被裁....
  8. 集成测试的“面子”和“里子”
  9. 20暨南大学计算机考研经验知乎,暨大应统经验转自知乎
  10. HTTP状态码及说明大全