GeoHash算法获取附近店铺和距离
1. 简介
GeoHash算法将二维经纬度坐标直接转换成字符串,每一个字符串代表一个矩形区域,也就是说,这个矩形区域内所有的点(经纬度坐标)都共享相同的GeoHash字符串,字符串的长度越大,矩形的区域就越小,经度也就越高。字符串相似的表示距离相近,这样可以利用字符串的前缀匹配来查询附近的POI信息。
2. GeoHash算法
地球纬度区间是[-90,90],经度区间是[-180,180],通过区间法对经度和纬度分别进行计算,假如我们获取到的当前坐标为经度-0.12866, 纬度38.534413,以纬度为例:
将纬度平均分成两个区间:[-90,0),[0,90],成为左区间和右区间,可以判断出38.534413属于右区间,则值为1,(如果属于左区间则值为0);
接着将右区间继续划分,就变成了[0,45),[45,90],此时,38.534413属于左区间,则值为0
递归上述过程,则区间的值会越来越逼近38.534413
随着算法的进行,我们将会得到一个序列,序列的长度跟递归的次数有关,但是一定要保证的是经度和纬度的序列长度是一样的,我这里设置的递归长度是30,经度和纬度加起来就是60,
根据算法我们最终得到经度的序列为
[0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0,0],
纬度的序列为
[1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1,0],然后我们根据此序列再组合一个新的序列偶数位放经度,奇数位放纬度,把2串编码组合生成新串[0, 1, 1, 0, 1, 1, 1, 1,1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0,0],实际上这个序列是一串二进制最后,我们将这个新串转换成十进制再使用0-9、b-z(去掉a, i, l, o)(base32编码)对这组十进制进行编码得到的字符串eyzgjnfr4p0p就是最终的GeoHash编码。
关于base32编码:
编码会去掉两种情况:
(1)元音,去除元音防止密码泄露,增加可靠性。如:hello world -> hll wrld
(2)容易混淆的字符,如:[1, I(大写i), l(小写L)],[0,O]
Base32解码:
GeoHash算法利用Base32将全球划分成32个大的区域块。
hash值转换成经纬度:
字符串越长,表示的范围越精确。5位的编码能表示10平方千米范围的矩形区域,而6位编码能表示更精细的区域(约0.34平方千米)。
a)在纬度相等的情况下:
经度每隔0.00001度,距离相差约1米;
每隔0.0001度,距离相差约10米;
每隔0.001度,距离相差约100米;
每隔0.01度,距离相差约1000米;
每隔0.1度,距离相差约10000米。
b)在经度相等的情况下:
纬度每隔0.00001度,距离相差约1.1米;
每隔0.0001度,距离相差约11米;
每隔0.001度,距离相差约111米;
每隔0.01度,距离相差约1113米;
每隔0.1度,距离相差约11132米。
其他base64编码.
我们将二进制编码的结果填写到空间中,当将空间划分为四块时候,编码的顺序分别是左下角00,左上角01,右下脚10,右上角11,也就是类似于Z的曲线,当我们递归的将各个块分解成更小的子块时,编码的顺序是自相似的(分形),每一个子快也形成Z曲线,这种类型的曲线被称为Peano空间填充曲线。
这种类型的空间填充曲线的优点是将二维空间转换成一维曲线(事实上是分形维),对大部分而言,编码相似的距离也相近, 但Peano空间填充曲线最大的缺点就是突变性,有些编码相邻但距离却相差很远,比如0111与1000,编码是相邻的,但距离相差很大。
3. 查找topK近的店铺
在上图中查找A点附近的点时,由于A点和C点是在同一个区域内,根据GeoHash算法认为A点附近只有C点,没有B点。但是实际上B点离A点甚至要比C点还要近,为了取得更精确的结果,除了目标点的GeoHash值外,还需要使用A点周围8个区域值的GeoHash值。
参考:
- base32;
- Geohash;
- GeoHash算法获取附近店铺和距离;
- 作者:NilMe;
- GeoHash核心原理解析;
GeoHash算法获取附近店铺和距离相关推荐
- 空间索引 - GeoHash算法及其实现优化
转自原文 空间索引 - GeoHash算法及其实现优化 上篇博客中提到了空间索引的用途和多种数据库对空间索引的支持情况,那么在应用层以下,好学的小伙伴应该会考虑空间索引的实现原理了. 目前空间索引的实 ...
- geohash网格图_空间索引 - GeoHash算法及其实现优化
前言 上篇博客中提到了空间索引的用途和多种数据库对空间索引的支持情况,那么在应用层以下,好学的小伙伴应该会考虑空间索引的实现原理了. 目前空间索引的实现有 R树和其变种GIST树.四叉树.网格索引等. ...
- java实现 GeoHash 算法(GeoHash位数与距离对应关系)
最近遇到一个问题,需要根据基站的经纬度给基站进行分组,两个基站距离相差10米内分到一组,最开始是通过两层循环处理的(笛卡尔积),这样的速度非常慢.最开始因为这个是偶尔还会运行一次,对效率也没要求,项目 ...
- 基于GeoHash算法的地理位置检索
地理位置检索服务在日常生活中随处可见,小到共享单车.高德地图,大到飞行航线轨迹.上述服务中很多相关功能都可以通过GeoHash来实现,Lucene/Solr中也有应用到GeoHash,通过GeoHas ...
- [990]Geohash算法原理及实现
文章目录 经纬度常识 基本原理 Geohash算法 GeoHash的精度 具体的计算方法 1.纬度相同,经度不同 2.经度相同,纬度不同 问题 代码实现 geohash在mysql中的使用 最近需要实 ...
- Geohash算法的概括
Geohash算法就是将经纬度编码,将二维变一维,给地址位置分区的一种算法. 基本原理 GeoHash是一种地址编码方法.他能够把二维的空间经纬度数据编码成一个字符串 我们知道,经度范围是东经180到 ...
- GeoHash算法与用法
/*** GeoHash算法** 可以到 http://geohash.co/ 进行geohash编码,以确定自己代码是否写错** @Description GeoHash字符串编码越长,表示的范围越 ...
- Geohash算法原理及实现
最近需要实现一个功能,查找车辆附近的加油站,如果车和加油站距离在200米以内,则查找成功. 加油站数量肯定不小,能否缩小查找范围,否则以遍历形式,效率肯定高不了. Geohash算法就是将经纬度编码, ...
- Redis之GeoHash算法
Redis之GeoHash算法 1 GeoHash 2 GeoHash在Redis中的使用 Redis3.2开始提供了GEO模块,该模块也使用GeoHash算法.(通用的) 功能:查看附件的酒店.加油 ...
最新文章
- CF375D Tree and Queries(dsu on tree)
- 日常工作问题的处理流程
- POJ 3164 Command Network (最小树形图)
- Intellij IDEA 神器那些让人爱不释手的小技巧
- Transaction rolled back because it has been marked as rollback-only
- 头条号为什么把作者抛弃了?
- java压缩zip文件中文乱码问题
- day14 Python函数
- 分享小记:指数族分布
- 火星坐标系(GCJ-02坐标系),CGCS2000坐标系,WGS-84坐标系
- php读取加密表格,Excel表格如何加密
- ALSA驱动框架简介
- 【对讲机的那点事】玩对讲机,你必须要了解的技术指标(下)
- 【kubernetes】k8s使用客户端连接haproxy访问高可用集群流程详细说明【使用kubeconfig连接haproxy】【kubeconfig配置全部流程】
- 分数化成有限小数的方法_小数化成分数的方法
- 一体机怎么修复音频服务器,导航一体机收音机信号不好?最全的自己动手修复教程来了!...
- 60 个 Python 小例子
- python mongodb_Python操作MongoDB文档数据库
- 【架构入门系列】从业务到平台的思维转变
- 服务器端 P44、25-42