相关性分析热点图_车联网数据分析(二):驾驶行为分析
出门在外,遇上交通拥堵、事故,那可真是头大。许多交通拥堵和交通事故与驾驶员的驾驶行为有关。驾驶行为通常也是驾驶习惯,习惯成自然。在开车的过程中,如果有不良的驾驶行为,驾驶员自己很难意识到,但是后果可能很严重。
车联网开启了新的可能,因为数据可以告诉我们真相。
基于车联网实时数据,可以实时监测和评估驾驶员的驾驶行为和驾驶状态,并及时提醒驾驶员改变驾驶习惯,避免交通事故的发生。
对于车队管理、保险公司(UBI)来说,可以提高安全、节能、增效等效果。对于车企(OEM)来说,是很好的实时反馈,可以用于产品改进。
“驾驶行为”是什么?
驾驶行为通常包括出行行为习惯,和驾驶行为习惯。出行行为的分析已经在上一篇谈到了。
狭义的驾驶行为包含,但不限于下面这些方面:
- 开车时
- 平均速度
- 引擎经济转速(燃油车)
- 急加速/千公里、急刹车/千公里
- 急转弯
- 变道次数/频率、变速频率
- 安全带状态、热车时间
- 开车灯(夜晚,远光灯/近光灯),转向时转向灯,变道时转向灯
- 怠速时间
- 手机使用、疲劳驾驶等
- 停车时
- 手刹、停车档、关门、关窗、关灯等
- 驾驶环境
- 路型、各地形的行驶里程、各个地形的驾驶时间、各地形的停车时间
- 天气、季节等
- 交通违规记录
此外,考虑到现今的各种辅助驾驶,驾驶员使用这些辅助驾驶功能的频次(依赖性)等,也是一个维度。
如果配上了各种传感器,比如:前向摄像头、环视摄像头、车内监控摄像头、毫米波雷达等,那么可以分析的内容将会更加丰富了。
基于不同的目的,将上述各个驾驶行为分量以某种加权的方式计算出一个分数(或指数),用来衡量用户的驾驶行为,或者给用户的驾驶行为打上各种标签。
不同的商业/研究目的,驾驶行为分数的计算公式都不一样。比如:保险公司设计UBI产品的时候,开车越平稳分数越高,开车次数/里程/时间越少,分数越高。
选择车联网数据
与第一篇一样,使用来自于同一辆车的原始数据。同样,仅仅拿少量的数据字段来分享数据分析的过程。管中窥豹,略见一斑。
因为车速和车速的变化在驾驶行为和安全上最突出,就是它了。
选择下面的数据项(又是3项):
- 时间戳 – 每条记录发生的日期和时间
- 车速(公里/小时)
- 引擎转速
与“用户出行行为分析”中的一样,
- 引擎转速用于判断车辆状态。
- 清洗、整理、聚合数据。
- 分割数据
实际操作中,把所有需要的字段都选进来,这些步骤就可以和“用户出行行为分析”一次完成。
处理完这些,我们期待一下有什么小小的惊喜出现吧。
驾驶行为分析
基于这 3 项数据,计划做下面几个方面的分析:
- 车速和怠速
- 加速度
- 急加速、急减速
- 加减速和怠速
- 驾驶行为分数
- 车速和怠速
在对所有数据动手之前,我们取第一个驾驶行程的数据来看看。它有 1854 条记录,时间跨度2479秒,也就是41.3分钟。说明中间有些数据缺失。
先看一看车速的分布图,如图1所示。
从这张图中可以看出来车速分布的大概情况:
- 车速中值达到63.63公里/小时,说明交通状况还是不错的。
- 最高速度在120公里/小时左右,说明该车主在此次行程中,没有超速(假设限速是120公里/小时)。
有了总体感觉后,按照时间顺序绘出汽车速度图,如图2所示。
蓝色横线标识120公里/小时,这是一般的高速公路限速值。仔细观察有下面几个特点:
- 在前面大约2/3的时间里,车子开开停停,平均车速较低;后面的交通状况变好了些,基本在60公里/小时的速度之上。
- 从相邻两点之间的距离可以推断,距离越大加速度(包括加速和减速)越大,可能存在急加速,或急减速。
- 相邻距离较大的点往往都是靠近车速为0的,也就是“怠速”前后。这是不是说明急加速/急减速与“怠速”之间存在某种必然的联系呢?还是让数据告诉我们吧!拭目以待!
- 此次行程中,似乎有一次超速(实际上该时刻车速是 119.996 公里/小时)。
我们用数据来验证一下上述肉眼观察的是否真是这么回事。
看看平均车速 – 怠速之间的关系。如图3所示,计算每一个驾驶行程的平均车速与怠速的百分比(怠速总时长/总驾驶时长)。
从上图中,可以看出:
- 负相关的关系:怠速时长(百分比)越小,对应的平均车速越大。
- 相关性不是特别严格,说明平均车速与更多的因素有关。
特别注意的是,这里观察的是平均车速与怠速时长之间的相关性,二者之间不存在因果关系。真正的主因应该是交通状况、拥堵、天气等外因(如果没有车子或者驾驶员自身的原因的话)。
笔者无意于在本篇扩大研究范围,去探讨到底还有哪些因素与平均车速有关,而是留待后续的汽车动态性能分析那一篇去深入研究,敬请期待。
上图2中显示可能有一次超速(实际不是)。对全部142次行程,计算每次行程的超速次数(> 120 公里/小时),并且绘制图4,如下所示。大多数行程下,该用户是没有超速的。
基于这些,可以统计超速次数、按时间计算超速百分比。具体数据将在驾驶行为分数部分列出来。
- 加速度
回想一下加速度计算公式:a = ,这里 v – 车速(米/秒2),t – 时间(秒)。
用通俗的话讲,加速度就是单位时间里速度的变化量。这个单位时间就是1秒。
笔者所使用的数据就是秒级的,但是由于部分数据缺失,相邻两条记录的时间间隔有时大于1秒,相邻记录的 就可以得到加速度(否则如果缺失数据较多,计算结果会有较大的偏差)。
车速的数据单位是公里/小时,这样计算的加速度单位是公里/小时.秒。两者之间只存在一个倍数关系,对后续的相关性分析没有什么影响,但是对设定急加速/急减速的阈值(比如:多大的加速度才算是急加速?)的时候需要注意这个差别。
以第一个驾驶行程的数据为例,计算每个时间点的加速度,并绘制在图上,如图5所示。
从图中可以看到,数据点落在0的数轴上表明加速度为0;在正向和负向的数据点看起来似乎差不多。
纵轴是加速度(公里/小时.秒),把它换算成标准单位(米/秒2)对于我们普通俗人来说可能没有什么感觉,数字大小和日常生活中的直觉很难建立起直观的联系,多大才会有推背感?多小才感觉舒适平稳?
以 Tesla Model 3 为例,它的百公里加速号称只需要3.5秒,按照加速度单位公里/小时.秒来计算平均加速度(不考虑这个3.5秒内实际加速度是变化的)就是:100/3.5 = 28.57 公里/小时.秒。
这是超跑的水平,主要秀在试车场、赛车场等,市场上大多数车子都达不到。对于普通家用轿车,百公里加速时间一般都在8秒开外。
以8秒的百公里加速水平计算平均加速度:100/8 = 12.5公里/小时.秒。
- 急加速、急减速
笔者以10公里/小时.秒作为判断急加速/急减速的阈值,超过+10为急加速,低于-10为急减速。
还是以第一次驾驶行程为例,重新绘制图5,标识出急加速和急减速的阈值,得到图6。
从图中可以清楚地看到,第一次驾驶行程中有两次急加速、两次急减速。
- 急加速急减速 vs. 怠速次数
在分析图2的时候观察到急加速急减速与怠速次数可能有相关性。现在就来验证一下。
回顾一下图2,在每一次怠速(车速 = 0)前后,相邻两点的距离比较大,但是这个距离和上面定义的急加速/急减速还是有一些差距的,所以,这里有意放宽加速度阈值到 5公里/小时.秒。
统计每一个行程超过这一阈值的加速度个数,绘制图7。
从图中可以看出,怠速次数与急加速急减速次数有较强的正相关性,这与我们最初的猜测是一致的。
通过线性拟合,如果8所示。
修正 R 方(Adjusted R-Squared)为 0.72,而且回归诊断显示模型比较合适,所以基本确定了二者的线性相关性。
其实,分析这个相关性本身没有什么现实价值,在这里主要是分享这个分析的过程。就像日常生活中的娱乐活动(我们把它叫做服务业,或第三产业),大多数也找不出有什么意义,只是娱乐而已。
- 驾驶行为分数
综合上述分析,把每一项指标的统计值列在下表中。
由前文已知,笔者仅仅选择了三项数据,分析的指标比较有限。
- 时间戳
- 车速
- 引擎转速
当我们把所有需要的驾驶行为 KPI 计算出来了之后,参考预先定义的计算公式,可以得出一个驾驶行为分数,然后就可以给这位用户(驾驶员)打上标签了。比如:新手,女司机,稳重老司机,狂野青年,等等。哎,我最怕被人贴标签了,没办法,人在江湖,身不由己
到目前为止,驾驶行为分析看起来都是简单的经典统计上的事情,好像有点 low,也有些枯燥哦。
如果把车内车外各种传感器的数据拿来,用上图像识别、环境/模式感知等各种深度学习技术,那样就一下子高逼格了。但是那就不是车联网数据了,超纲了(相对这个系列而言)。希望不久的未来和大家一起探讨这个话题哦。
下一篇,笔者将会分享基于车联网数据的汽车动态行为分析,敬请期待!
如需联系,请私信;或者微信号:jingelaoma
附:
汽车、出行大数据分析zhuanlan.zhihu.com
相关性分析热点图_车联网数据分析(二):驾驶行为分析相关推荐
- 相关性分析热点图_高分文章中物种与代谢物相关性热图是怎么画的?
测序行业的蓬勃发展,带来微生物组学日新月异的变化.目前,单一组学的文章不断"贬值",前沿研究的目光从单一组学逐步拓展至多组学对贯穿分析,即结合多个组学的分析角度,从多个层面阐述生物 ...
- 相关性分析热点图_防老剂TMQ及6PPD价格上涨逻辑分析及后市展望
[导语] 5月份防老剂TMQ和6PPD价格在结束近3年来的震荡下滑后迅速上涨,但此次涨价与历史涨价不同的是在出口受阻及国内需求偏弱形势下,原料价涨施压成本引起防老剂供需错配,导致防老剂价格出现的被动上 ...
- swot分析法案例_(附数据集)SWOT分析实战案例!
最近一直在为一件事苦恼,开在市中心的那家西点店的生意越做越好,分店也开了两家,但挣得这点钱还是不够买房子.这不,最近看上了这如火如荼的奶茶市场,想借现有资源开一家奶茶店,但不知道这个想法靠不靠谱,要不 ...
- 实时即未来,大数据项目车联网之车辆驾驶行程分析【十三】
文章目录 车辆驾驶行程分析 驾驶行程分析业务逻辑 1 车联网项目数据存储分层设计 2 车辆驾驶行程定义 1 驾驶行程业务简介 2 驾驶行程分析流程 3 驾驶行程分析业务价值 2. 驾驶行程分析任务设置 ...
- java内存分析详解_深入java内存查看与分析详解
1:gc日志输出在jvm启动参数中加入 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimestamps -XX:+PrintGCApplicationS ...
- powerdesign怎么画分析类图_画一个彭于晏
教大家画个彭于晏. 分析 每个画画的都知道,首先拿到这个图片,不要着急去画,先抽根烟静下心来,分析一波情况,磨刀不误砍柴工. 首先我们来分析一下他的五官. 眼神十分的销魂,鼻梁十分的高挺,嘴巴很好看, ...
- gephi生成网络关系图_用 NetworkX + Gephi + Nebula Graph 分析lt;权力的游戏gt;人物关系(上)
我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜",当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 Ne ...
- jqc3ff继电器引脚图_单片机控制继电器驱动电路图原理分析
首先看看继电器的驱动 这是典型的继电器驱动电路图,这样的图在网络上随处可以搜到,并且标准教科书上一般也是这样的电路图 为什么要明白这个图的原理? 单片机是一个弱电器件,一般情况下它们大都工作在5V甚至 ...
- 51cto python数据分析系列课程 55g_热图_ Python数据分析系列视频课程--玩转数据可视化_数据可视化视频-51CTO学院...
matplotlib包是基于Python平台的统计绘图利器,是在python平台上完成数据可视化不可或缺的工具,而基于matplotlib进一步开发的seaborn,更是将数据呈现与可视化的可用性推到 ...
最新文章
- Learn OpenGL (十):材质
- QT旋转按钮控件的实现
- LeetCode 421. 数组中两个数的最大异或值
- Codeforce-CodeCraft-20 (Div. 2)-B. String Modification (找规律+模拟)
- UML入门之类图教程
- jsonp-反向代理-CORS解决JS跨域问题的个人总结
- jboss4 迁移_应用程序服务器迁移:从JBoss EE5到Wildfly EE7
- 习题2.1 简单计算器 (20 分)
- python x y 定位点击,python - Python找到一个点相对于其他四个已知点的x,y位置 - 堆栈内存溢出...
- Oracle基础 10 表 table
- Web实训项目--网页设计(附源码)
- 数字图像处理使用计算机对,数字图像处理的应用现状及发展方向
- ncbi下载数据sra和转换fastq流程
- 供应链金融——研究结果总结
- 阿里玄难:面向不确定性的软件设计几点思考
- 四级网络工程师笔记-计算机网络(下)
- 如何让他喜欢你?让他多看一眼
- Tutorial 05: Synching Video
- 什么蓝牙耳机性价比高?四款高品质蓝牙耳机测评
- CSP题目:小明种苹果树
热门文章
- multisim变压器反馈式_基于Multisim的负反馈放大电路仿真分析
- Module3:Alice in Wonderland
- 一道蚂蚁金服简单的上机笔试题
- android 第三方扇形图,Android扇形图(饼状图)
- Java Eclipse internal error Polling news feeds 解决方案
- dll注册加载失败解决方法,请确保二进制的解决办法(无数踩坑试出来的)
- 智能媒体管理产品文档转换/预览功能介绍(1)---Cloud Native架构
- 逆光人物摄影构图灵感经验分享,在集设网参与设计大咖的成长之路!
- U盘容量会“缩水”当心文件丢失
- MQTT-java使用说明