最近刚开始学用python进行简单爬虫,(关于python简单爬虫网易云课堂上有教程,俩小时学会http://study.163.com/course/courseMain.htm?courseId=1003285002),这里用到的工具是教程中提到的jupyter notebook

首先打开chrome浏览器,进入百度地图,点开开发者工具-network:

假设我们要爬取的是成都市双流区的边界点坐标,在搜索栏中输入双流区,点击清空按钮清屏,再点击搜索

可以看到地图中多了一个行政区图层,我们需要做的是观察下方的响应,找到图层对应的链接,通过简单搜寻可以发现在XHR下的某个文件,它的response可能包含了行政点信息:

通过点开链接发现的确如此:

该网址如下:
https://map.baidu.com/?newmap=1&reqflag=pcmap&biz=1&from=webmap&da_par=direct&pcevaname=pc4.1&qt=ext&num=1000&l=10&uid=969ab43816104a0cb54f54e4&tn=B_NORMAL_MAP&nn=0&ie=utf-8&b=(11524830.669662053,3523233.4366656514;11632785.714980276,3576021.624079733)&t=1534420430415
观察网址构成,发现uid部分应该是行政编号信息,因此编写程序:
from bs4 import BeautifulSoup
import requests
url=’https://map.baidu.com/?newmap=1&reqflag=pcmap&biz=1&from=webmap&da_par=direct&pcevaname=pc4.1&qt=ext&num=1000&l=10&uid={}&tn=B_NORMAL_MAP&nn=0&ie=utf-8&b=(11524830.669662053,3523233.4366656514;11632785.714980276,3576021.624079733)&t=1534420430415’
id=’969ab43816104a0cb54f54e4’
mapurl=url.format(id)
res=requests.get(mapurl)
res.encoding=’utf-8’
soup=BeautifulSoup(res.text,’html.parser’)
print(res.text)
理论上,只要知道各行政区的代码,便可以编写循环遍历所有需要的行政区边界点数据。

python简单爬虫获取行政边界点坐标相关推荐

  1. 手把手教你使用Python网络爬虫获取B站视频选集内容(附源码)

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 位卑未敢忘忧国,事定犹须待阖棺. ...

  2. Python简单爬虫第六蛋!(完结撒花)

    第六讲: 今天我们来实战一个项目,我本人比较喜欢看小说,有一部小时叫<圣墟>不知道大家有没有听说过,个人觉得还是不错的,现在联网的时候,都可以随时随地用手机打开浏览器搜索查看,但是有时候也 ...

  3. 小猿圈分享利用python网络爬虫获取网易云歌词

    今天小猿圈给大家分享网易云音乐歌词爬取方法. 本文的总体思路如下: 找到正确的URL,获取源码: 利用bs4解析源码,获取歌曲名和歌曲ID: 调用网易云歌曲API,获取歌词: 将歌词写入文件,并存入本 ...

  4. python简单爬虫

    python简单爬虫某网站简历模板 from lxml import etree import requestsdef main():url = "https://sc.chinaz.com ...

  5. python简单爬虫 指定汉字的笔画动图下载

    python简单爬虫 指定汉字的笔画动图下载 分析过程 打开网址首页http://www.hanzi5.com 选择一个字,比如"虐" 查看该汉字动图地址 右键该汉字动图,选择在新 ...

  6. Python网络爬虫获取淘宝商品价格

    1.Python网络爬虫获取淘宝商品价格代码: #-*-coding:utf-8-*- ''' Created on 2017年3月17日 @author: lavi ''' import reque ...

  7. Python 简单爬虫下载小说txt

    Python 简单爬虫下载小说txt #第一次写爬虫代码 欢迎交流指正 我们范例爬取的对象是笔趣阁的<圣墟> (最近非常火的连载小说) ##为什么选择笔趣阁# 主要是因为笔趣阁的源代码没有 ...

  8. 利用Python网络爬虫获取分类图片,简单处理反爬教学

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 本文章来自腾讯云 作者:Python进阶者 想要学习Python?有问题得不到第一 ...

  9. python简单爬虫程序分析_[Python专题学习]-python开发简单爬虫

    掌握开发轻量级爬虫,这里的案例是不需要登录的静态网页抓取.涉及爬虫简介.简单爬虫架构.URL管理器.网页下载器(urllib2).网页解析器(BeautifulSoup) 一.爬虫简介以及爬虫的技术价 ...

  10. python简单爬虫入门一_Python爬虫快速入门:基本结构简单实例

    本爬虫系列入门教程假设读者仅有一点点Python基础或者近乎为零的基础.如果是有Python基础的可以跳过一些对于Python基本知识的补充. 爬虫能干什么呢?一句话概括,正常通过浏览器可以获取的数据 ...

最新文章

  1. Bash脚本: 根据关键字做替换
  2. 第二阶段冲刺第六天(6月5号)
  3. R语言安装;Rstudio安装
  4. 段选择符和段描述符的关系
  5. cocos2d中CCSprite的使用总结 【转】
  6. 假设检验1——理论基础
  7. 八爪鱼采集ajax表格,设置八爪鱼采集器ajax延时采集分页列表的方法
  8. android手机diy,手把手教你如何DIY个性定制属于你的安卓手机浏览器
  9. JAVA音程_桌面应用|与 Linux 一起学习:学习音乐
  10. 杨辉三角(Python-动态规划)
  11. 聊天软件黑盒测试,duckchat
  12. 自制适合城市家庭的鱼菜共生系统
  13. win10ftp服务器上传文件时提示报错,win10 ftp服务器 无权限问题
  14. Android webview Input type=file 文件上传 解决方法
  15. Android基础与手机历史
  16. python中怎么创建配置文件,python怎么读取配置文件
  17. python发送邮件 SMTP socks代理
  18. TIOBE 2月编程语言排行榜出炉:Python遥遥领先C语言
  19. 一键备份脚本backup.sh
  20. Dagger2的使用总结

热门文章

  1. 上位机与下位机进行交互
  2. 关于SOME/IP的理解
  3. AD9833资料收集
  4. 格雷码转二进制c语言程序,systemC构建格雷码和二进制的转换
  5. 开源BI工具superset的汉化
  6. mysql 网吧管理系统设计_网吧管理系统开题报告.doc
  7. 【web前端特效源码】使用HTML5+CSS3+JavaScript制作一个进度条动画效果~适合初学者~超简单~ |前端开发|IT软件
  8. HTML前端特效集合
  9. JAVA多线程面试题整理及答案
  10. idea热部署(更新jsp代码不用重编译Tomcat)