GPS数据是日常特征构建时极为重要的原始数据。我们可以从GPS数据中获得申请人的地理位置信息,从而通过对应城市的信用情况和申请人周围地理特征来建模。更多风控干货学习,关注【金科应用研院】,回复CSDN,还可领资料礼包一份。

然而,在爬取GPS原始数据时,传输过来的通常是经纬度。因此,我们需要对申请人的经纬度进行处理,从而得到:

经纬度对应的省市区
经纬度周围的商业店铺情况

有一些付费的第三方API可以帮忙解决以上两个问题。但是,GPS数据的量通常都很大,这一笔费用并不划算。

并且,如果在大数据spark环境下,对GPS点进行一个一个query也是非常花时间的。

为了低成本且快速地解决GPS的地理对应问题,本文将会介绍两种GPS地址编码方法。它们是Geohash和Hexagon编码。

1、Geohash和Hexagon编码简介

Geohash和Hexagon都是地址编码。其中,Geohash是一个在地图上的四方格子,只要处于这个格子内部的GPS点,通过调包计算就可以得到格子的编码。

如图1所示,格子内部就是这个格子的Geohash编码。如果有格子的Geohash编码,想要转换成GPS经纬度也是非常方便的。简单的调包计算就可以得到格子中心点和四个角的GPS经纬度。图1:Geohash格子

Hexagon是在地图上的六边形格子。也是通过调包计算就可以得到Hexagon编码,有Hexagon编码则可以反向计算得到格子中心点和六个角的GPS经纬度。

2、Geohash和Hexagon的编码级别

Geohash和Hexagon这两个地图编码都是有级别的。如图二所示,7个低级别的Hexagon格子可以拼接成一个更高级别的格子。而Geohash的是四个低级别格子可以组成一个更高级的格子。

图二:Hexagon格子

关于Geohash编码的级别和其对应的每个级别格子的面积大小如表1所示。

Geohash编码一共有8个级别,我们平时使用的是级别6,范围大概是方圆500米。如果是想要防范某个集体欺诈团伙可以使用级别7的格子编码。

表1:Geohash格子级别与面积对照表
Hexagon编码一共有15个级别。我们通常使用级别8,大概方圆700米的范围。如果想更精确些,可以使用级别9或者10。

表2:Hexagon格子级别与面积对照表

3、使用Geohash和Hexagon地址编码的优点总结

将GPS点转换成Geohash和Hexagon地址编码的优点:

1.可以极大减少call收费的地理数据API的次数。例如,有100个GPS点都处于一个Geohash级别6的格子里面。我们就可以只query一次收费的API,找到这个Geohash编码的地理信息。

2.更高速且效率地对GPS数据进行计算。例如,我们需要对1万个GPS点进行两两地距离计算。直接计算的话,计算量非常大的。如果是先将这1万个GPS点mapping到1百个Geohash格子上地话,再计算两个格子直接地距离,计算量就会大大下降。

因此,本质上,使用Geohash和Hexagon地址编码就是为了低成本和高速地对GPS点数据进行操作与计算。同时,我们也需要放弃一些精度。

以上,本文介绍了Geohash和Hexagon地址编码。在下一篇分享中,我会展示如何具体通过这两种编码进行高速,低成本地mapping出经纬度的各项数据。

做风控的你,GPS数据有没有这样用?相关推荐

  1. 风控每日一问:互联网金融产品如何利用大数据做风控?

    互联网金融产品如何利用大数据做风控? 相关解答 互联网金融产品太多,这里以P2P网贷为例,从风控涉及的相关环节分别来尝试讨论 销售环节: 了解客户申请意愿和申请信息的真实性适用于信贷员模式,风控关键点 ...

  2. 【风控流程】大数据风控代码逻辑

    写在前面: 此文为一个简单的风控决策模型的开发逻辑及细节,仅供科技金融领域做风控建模的新手参考,具备能够看懂并且尝试风控模型开发及部署的能力. 跃跃欲试吧. [博客地址]:https://blog.c ...

  3. 动手学无人驾驶(6):基于IMU和GPS数据融合的自车定位

    在上一篇博文<动手学无人驾驶(5):多传感器数据融合>介绍了如何使用Radar和LiDAR数据对自行车进行追踪,这是对汽车外界运动物体进行定位. 对于自动驾驶的汽车来说,有时也需要对自身进 ...

  4. Matlab Mobile手机版获取gps数据和加速度信号融合

    Matlab Mobile手机版获取gps数据和加速度信号融合 前言 安装matlab mobile Matlab Drive Connector 安装 Matlab Mobile 记录数据 Matl ...

  5. [转载]Palm 串行通讯GPS数据读取的实现

    Palm 串行通讯GPS数据读取的实现 关于J2ME程序编写的教程,各大网站均有介绍.但是J2ME教程的学习与实际应用毕竟还有一段距离.笔者从事J2ME一年多, 已经成功地开发出基于无线互联网palm ...

  6. stm32 m5311上传gps数据上onenet云平台实现地图定位

    新手,第一次写博客,如有不足请大家见谅并指出.下面开始正文. 本文是帮一个朋友做一个NB_Iot的小东西这个过程的学习记录吧. NB模块是M5311,然后还有一个stm32f103的最小系统开发板,后 ...

  7. websocket实现GPS数据的实时推送与地图的展示(优化)

    概述 前两天,发布了一片文章websocket实现GPS数据的实时推送与地图的展示,文章发出后引来了不少读者的关注,也有不少读者要求做进步一优化.本文应大家的要求,对上文的内容做一个优化,优化地方包括 ...

  8. 基于大数据风控方向的大数据计算平台需求整理

    基于大数据风控方向的大数据计算平台需求整理 背景 为响应国家深化金融体制改革的要求,各大金融机构都在探索服务下沉,包括信托行业在内,很多金融机构都在尝试消费金融各种场景.而信托行业在进军消费金融的路上 ...

  9. 做风控到底是做什么?

    风控包含了两类工作,即风险管理和内部控制,但在不同类型的企业中,风控的管理及控制的领域方向也会有所不同. 这并不算是个新职业,但我们发现它的 职业发展势头正变得越来越好.根据科锐国际的统计数据表明,在 ...

最新文章

  1. 车道线检测:几何约束联合车道分割和车道边界检测
  2. 初探 开源视频会议 openmeeting
  3. java 循环读取文件_您如何用Java连续读取文件?
  4. Jboss4集群配置【转】
  5. linux c之gcc -g file.c -o file提示warning: no newline at end of file
  6. 自己动手写java虚拟机_自己动手写操作系统(要了解的知识点)
  7. 打造优秀B端产品需求分析流程要点
  8. 提高级:初等数论 威尔逊定理
  9. npkill(安全快速的清理电脑上的 node_modules)
  10. gitlab上传本地项目_环境搭建:gitLab平台的搭建和简单使用
  11. 视频直播的购物平台,网站,app
  12. win7旗舰版激活提示错误代码0x80072EE2的最简单解决办法
  13. SQL注入-waf绕过
  14. MATLAB寻找水仙花数字
  15. #51CTO学院四周年#而立之年的不二之选
  16. Android acra 日志上报,android acra错误日志上报
  17. hsgcc:面试笔记
  18. php时间戳,日期时间转换及使用大全
  19. 广东计算机专业软件排名前十大学,2017年全国计算机专业大学排名一览表
  20. 3D卷积的GEMM+IM2COL实现

热门文章

  1. mysql获取当月数据_Python + MySQL如何获取股票数据(历史数据)
  2. led计数电路实验报告_LED点亮程序
  3. java设计模式 单例_java设计模式--单例模式
  4. oracle批量更新数据从另一表_全市场期货数据的批量下载和更新
  5. 辐射4核能选项用计算机失败,gg修改器出现保护进程加载失败怎么解决 | 手游网游页游攻略大全...
  6. SQLi LABS Less-22
  7. Selenium的一些技巧与错误处理
  8. 远程开启admin$共享(远程管理需开启如dameware软件)
  9. Linux下清除DNS缓存
  10. stl 优先队列(堆)