业余时间研究了一下兴趣点这一常见GIS数据的获取,总结如下。

获取思路

  • 1、将待抓取区域切割成一定大小的矩形,如400米边长的矩形;
  • 2、对每个矩形调用百度/高德等提供的接口,获取该矩形范围内兴趣点数据。
  • 3、将兴趣点数据去重合并。

注意事项

坐标系

受国内政策、地图平台自身商业需要,各地图平台使用的坐标系各有不同。

  • 百度:BD09;
  • 高德:GCJ02;
  • 腾讯:GCJ02;
  • 天地图:CGCS 2000;

去重

兴趣点注意根据百度等返回的ID去重。

成果--PoiCrawler

PoiCrawler是使用C#编写的一个跨平台命令行工具,支持对国内各层级行政区(粒度最小到区县)的各类兴趣点数据获取。

使用

PoiCrawler -n 任务名称 -r 行政区划编码 -t 类型 -g 网格边长(米,默认400) -w 并行抓取数量(默认2)-i 抓取频率(秒,默认1秒)

  • 抓取结果会自动生成在抓取器文件夹下,文件名同如任务名称;
  • 抓取结果为WGS84坐标系;结果已去重;
  • 抓取结果为CSV格式;
  • 抓取没有总量,频率限制。

使用样例

PoiCrawler crawl -n 武汉餐饮 -r 420100 -t 餐饮服务 //抓取武汉市餐饮类型兴趣点
PoiCrawler crawl -n 武昌区餐饮 -r 420106 -t 餐饮服务 -g 400 -w 2 -i 1 //抓取武昌区餐饮类型兴趣点,以400米边长的矩形进行分割,抓取间隔为1秒(越短越快),抓取协程数是2(越多越快)
PoiCrawler list     //列举可获取的兴趣点类型和行政区划编码表
image.png
列举类型
抓取结果

POI(兴趣点)抓取工具相关推荐

  1. hacker代码_如何仅用7行R代码构建Hacker News Frontpage抓取工具

    hacker代码 by AMR 通过AMR 如何仅用7行R代码构建Hacker News Frontpage抓取工具 (How to build a Hacker News Frontpage scr ...

  2. 电子邮件地址抓取工具

    从互联网上自动搜索电子邮件地址,电子邮件地址抓取工具是一款绿色软件,它将自动搜索网络并抓取电子邮件地址. 点击下载 转载于:https://www.cnblogs.com/JiangHuakey/ar ...

  3. 系统检测到您正在使用网页抓取工具访问_从网站抓取数据的3种最佳方法

    halo,大家好,我是特仑苏,今天呢给大家分享一些Python从网站抓取数据的一些方法,希望可以给大家带来一些帮助! 原作者:Octoparse团队 原出处:作品文(从网站抓取数据的3种最佳方法)/网 ...

  4. 一个简单的网页抓取工具

    前两天遇到一个妹子,她说不会从拉网页,我想用node做个网页抓取工具是何尝的简单,于是装x之路开始了. 其实想法很简单,由网址得到html,由html解析css,js,image等,分别下载就行了, ...

  5. asp.net 获取全部在线用户_提取在线数据的9个最佳网页抓取工具

    Web Scraping工具专门用于从网站中提取信息.它们也被称为网络收集工具或Web数据提取工具. Web Scraping工具可以在各种场景中用于无限目的. 比如: 1.收集市场研究数据 网络抓取 ...

  6. 系统检测到您疑似使用网页抓取工具访问本_12款最常使用的网络爬虫工具推荐...

    网络爬虫在当今的许多领域得到广泛应用.它的作用是从任何网站获取特定的或更新的数据并存储下来.网络爬虫工具越来越为人所熟知,因为网络爬虫简化并自动化了整个爬取过程,使每个人都可以轻松访问网站数据资源.使 ...

  7. 开箱即用的高匿代理抓取工具

    golang-proxy v3.0 golang-proxy是一个开箱即用的高匿代理抓取工具, 它是语言无关的 项目地址: https://github.com/storyicon/golang-pr ...

  8. WebSpider蓝蜘蛛网页抓取工具5.1用户手册

    概述 关于网页抓取工具 本工具可以抓取互联网上的任何网页,包括需要登录后才能访问的页面.对抓取到页面内容进行解析,得到结构化的信息,比如:新闻标题.作者.来源.正文等.支持列表页的自动翻页抓取,支持正 ...

  9. 数据抓取工具有哪些-数据抓取工具免费推荐的有哪些

    随着社会的进步,科技的发展.不管是企业还是个人都清楚地明白了数据的重要性.不仅可以让我们掌握一手资源,同时还能通过数据更清楚竞争对手.同时也告别了手动复制粘贴的痛苦. 企业人员 通过爬取动态网页数据分 ...

  10. 谷歌地图商家抓取工具 G-Business Extractor 7.5

    G 业务提取器 | 谷歌地图抓取工具 G-Business Extractor是一款功能强大的工具,可帮助您从 Google 地图中寻找商机.它是最好的Google Maps Scraper工具,能够 ...

最新文章

  1. 3ds Max V-Ray5 完整指南大师班视频教程
  2. 深入理解java虚拟机---读后笔记(垃圾回收)
  3. linux blender 中文乱码,Blender2.7.8中文显示框框乱码该怎么办?
  4. Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读
  5. Python基础知识-优雅的with as语句
  6. pcl中set程序_PCL中分割方法的介绍(3)
  7. YoloV5实战:手把手教物体检测
  8. java 关于集合的笔试题_Java集合面试题(一)
  9. 英语阅读理解关于计算机,一篇摘选的关于计算机的英语阅读材料,对大家的英语也许会有提高!...
  10. PyTorch 学习笔记(二):PyTorch的数据增强与数据标准化
  11. 工厂三兄弟之简单工厂模式(三)
  12. matlab中除法的错误使用
  13. 小程序源码:老人疯狂裂变引流视频推广
  14. cvpr 2018 image caption generation论文导读(含workshop)
  15. 【PMP】PMBOK 笔记 第12章 项目采购管理
  16. 1亿条数据批量插入 MySQL,哪种方式最快
  17. iOS上架App Store详解(图文)
  18. 完成10亿元D轮融资,易快报成费控SaaS独角兽?
  19. JS(JQ)实现table表格固定表头且表头可以随横向滚动而滚动
  20. angular报错信息之 'zmz-select' is not a known element

热门文章

  1. Behavior Creator 行为树可视化编辑器
  2. 计算机中英文打字文章,中英文混合打字文章
  3. 在电脑上如何用桌面便签进行日程管理?
  4. LU分解 LDL分解 Cholesky分解
  5. qt.qpa.plugin: Could not load the Qt platform plugin “xcb“ in问题
  6. RTF文件结构分析及其应用
  7. cdrx4自动排版步骤_教你用CorelDRAW X4轻松排出干净整齐段落
  8. 中望3d快捷键命令大全_autocad2014快捷键命令大全
  9. 软件测试技术(思维导图)
  10. x64位call代码注入器1.0版