目前的工作是需要对用户的一些数据进行分析,每个用户都有若干条记录,每条记录中有用户的一个位置,是用经度和纬度表示的。
还有一个给定的数据库,存储的是一些已知地点以及他们的经纬度,内有43W多条的数据。
现在需要拿用户的经纬度和已知地点进行距离匹配,如果它们之间的距离小于一定的数据,比如说500米,就认为用户是在这个地点。
MYSQL本身是支持空间索引的,但是在5.x的版本中,取消了对Distance()和Related()的支持,参考这里:MySQL 5.1参考手册 :: 19. 中的空间扩展 19.5.6. 测试几何类之间空间关系的函数, 无法使用空间的距离函数去直接去查询距离在一定范围内的点。所以,我首先想到的是,对每条记录,去进行遍历,跟数据库中的每一个点进行距离计算,当距离小 于500米时,认为匹配。这样做确实能够得到结果,但是效率极其低下,因为每条记录都要去循环匹配40W条数据,其消耗的时间可想而知。经过记录,发现每 条记录处理的时间消耗达到1700ms,针对每天上亿的数据量,这样一个处理速度,让人情何以堪啊。。。
我自己也有个想法,就是找到每条记录所在点的经纬度周围的一个大概范围,比方说正方形的四个点,然后使用mysql的空间计算,使用MBR去得出点在这个矩形内的已知记录,然后进行匹配。可惜,自己没想出能计算到四个点经纬度的方法。
意外的,查询到了一个关于这个计算附近地点搜索初探,里面使用python实现了这个想法。
所以参考了一下原文中的算法,使用PHP进行了实现。
实现原理也是很相似的,先算出该点周围的矩形的四个点,然后使用经纬度去直接匹配数据库中的记录。

红色部分为要求的搜索范围,绿色部分我们能间接得到的结果范围

参考wiki百科上的一些球面计算公式:

  • Great-circle distance
  • Haversine formula

假设已知点的经纬度分别为$lng, $lat
先实现经度范围的查询,
在haversin公式中令φ1 = φ2,可得:

用PHP进行计算,就是:

Example
1
2
3
//$lat 已知点的纬度
$dlng =  2 * asin(sin($distance / (2 * EARTH_RADIUS)) / cos(deg2rad($lat)));
$dlng = rad2deg($dlng);//转换弧度

然后是纬度范围的查询,
在haversin公式中令 Δλ = 0,可得

在PHP中进行计算,就是:

Example
1
2
$dlat = $distance/EARTH_RADIUS;//EARTH_RADIUS地球半径
$dlat = rad2deg($dlat);//转换弧度

最后,就可以得出四个点的坐标:
left-top : (lat + dlat, lng – dlng)
right-top : (lat + dlat, lng + dlng)
left-bottom : (lat – dlat, lng – dlng)
right-bottom: (lat – dlat, lng + dlng)

我把以上方法写成了一个函数,综合起来就是:

Example
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
define(EARTH_RADIUS, 6371);//地球半径,平均半径为6371km
 /**
 *计算某个经纬度的周围某段距离的正方形的四个点
 *
 *@param lng float 经度
 *@param lat float 纬度
 *@param distance float 该点所在圆的半径,该圆与此正方形内切,默认值为0.5千米
 *@return array 正方形的四个点的经纬度坐标
 */
 function returnSquarePoint($lng, $lat,$distance = 0.5){
    $dlng =  2 * asin(sin($distance / (2 * EARTH_RADIUS)) / cos(deg2rad($lat)));
    $dlng = rad2deg($dlng);
     
    $dlat = $distance/EARTH_RADIUS;
    $dlat = rad2deg($dlat);
     
    return array(
                'left-top'=>array('lat'=>$lat + $dlat,'lng'=>$lng-$dlng),
                'right-top'=>array('lat'=>$lat + $dlat, 'lng'=>$lng + $dlng),
                'left-bottom'=>array('lat'=>$lat - $dlat, 'lng'=>$lng - $dlng),
                'right-bottom'=>array('lat'=>$lat - $dlat, 'lng'=>$lng + $dlng)
                );
 }
//使用此函数计算得到结果后,带入sql查询。
$squares = returnSquarePoint($lng, $lat);
$info_sql = "select id,locateinfo,lat,lng from `lbs_info` where lat<>0 and lat>{$squares['right-bottom']['lat']} and lat<{$squares['left-top']['lat']} and lng>{$squares['left-top']['lng']} and lng<{$squares['right-bottom']['lng']} ";

在lat和lng上建立一个联合索引后,使用此项查询,每条记录的查询消耗平均为0.8毫秒,相比以前的1700ms,真的是天壤之别啊。效率真真的是以前的2125倍~~

总结:这应该也不是效率最好的办法,但是效率比以前确实有明显的提升。请记住,总有办法更好的。

原文链接:http://digdeeply.org/archives/06152067.html

转载于:https://www.cnblogs.com/longhao/p/4071275.html

PHP,Mysql-根据一个给定经纬度的点,进行附近地点查询–合理利用算法,效率提高2125倍...相关推荐

  1. Java进阶(五十)根据一个给定经纬度的点,进行附近500米地点查询–合理利用算法

    文章目录 一.前言 二.原理 三.思路 四.Java实现 一.前言 最近做一个项目:需要查询一个站点(已知该站点经纬度)1km-10km范围内的其它站点.所以,我首先想到的是,对每条记录,去进行遍历, ...

  2. 根据一个给定经纬度的点,进行附近500米地点查询–合理利用算法

    最近做一个项目:需要查询一个站点(已知该站点经纬度)500米范围内的其它站点.所以,我首先想到的是,对每条记录,去进行遍历,跟数据库中的每一个点进行距离计算,当距离小于500米时,认为匹配.这样做确实 ...

  3. php 输入经纬度查询位置,PHP根据一个给定经纬度的点,进行附近地点查询–合理利用算法...

    实现原理先算出该点周围的矩形的四个点,然后使用经纬度去直接匹配数据库中的记录. //获取周围坐标 public function returnSquarePoint($lng, $lat,$dista ...

  4. 一个比requests还好用的Python高效爬虫库,效率提高一倍!

    原文地址:https://juejin.cn/post/7099280151648665613 大家好!我是菜鸟哥 最近公司  Python 后端项目进行重构,整个后端逻辑基本都变更为采用" ...

  5. GPS定位,经纬度附近地点查询–C 实现方法

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 目前的工 ...

  6. mysql与php驱动程序_用PHP和MySQL构建一个数据库驱动的网站_php

    在我们目前的情况下,我们所需要的列是Jokes表中的JokeText列以及Authors表中的Name列和Email列.Jokes表和Authors表的关联条件是Jokes表中的AID列的值等于Aut ...

  7. 给定经纬度定位某个城市

    方案1 通过GEO HASH,抓取每个格子里的点的地址信息,然后把这个地址信息作为GEO中点坐标的一个信息,当查询给定经纬度是在哪个城市的时候,查询过程是查询距离这个经纬度最近的带有地址的点,认为给定 ...

  8. mysql 下 计算 两点 经纬度 之间的距离 含具体sql语句

    mysql取字段逗号分隔的第一个 cover字段为:(admin/LUpiEMD1Pk6U6B,admin/LUpiEMD1Pk6U6B,admin/LUpiEMD1Pk6U6B) 取逗号分隔第一个词 ...

  9. 给定经纬度,计算附近多少公里范围内的地点

    场景:当时我们项目用的是spring-data-jpa, 用hql实现的话,实在是不知道怎么搞,所以想出这么个方法.这样做的就是避免直接在数据查询语句中去计算该点附近多少公里范围内的点,将sql语句的 ...

最新文章

  1. HDU4143-A Simple Question数论题解
  2. Qt C++属性类型提供给 QML调用(三)
  3. maven工程拆分与聚合的思想
  4. 甜蜜助攻!情侣之间,到底能有多甜甜甜甜甜甜甜甜
  5. C++primer第九章 顺序容器 9.3 顺序容器操作
  6. shell中循环执行某个进程获取返回值,并循环执行直到函数出错
  7. android 自定义水波纹点击效果Button
  8. require()与 require_once()、 include与include_once()
  9. readonly 与 const
  10. python零基础自学教材-Python零基础入门到精通自学视频教程
  11. linux 安装talib
  12. 六自由度机械臂仿真设计|包括UR5|Puma|victor5|运动学正逆解介绍|MATLAB机器人工具箱|Adams仿真
  13. foobar2000后台运行
  14. Caesar解密-number theroy
  15. T-SQL简介及基本语法
  16. html水平线变虚线,html水平线 虚线
  17. android-player 本地服务器联调
  18. 订单查询系统c语言作业,C语言设计订单管理系统答题.doc
  19. 【# [ABC006A] 世界のFizzBuzz】
  20. 区块链为什么这么火热?

热门文章

  1. 扎实的基础是成功的法宝
  2. C 温故知新 之 指针:数组指针、字符串指针、函数指针
  3. 知其所以然~redis的原子性
  4. 9、C语言 —— 指针的用处
  5. 怎样查看Oracle的数据库SID和用户名
  6. Nginx应用案例分享:压力测试
  7. WinDBG 技巧:如何生成Dump 文件(.dump 命令)
  8. IIS7报“假”正式版随Server 2008发布
  9. 版本字符串比较工具接口常用接口函数
  10. 玩Azkaban跳过的坑