大数据模型研究报告pdf_高速公路大数据模型研究.PDF
高速公路大数据模型研究
高速公路大数据模型研究
国家统计局服务业统计司 李卉、申孟宜、展国殿
摘 要
本文运用大数据思想,创造性地建立了基于高速公路联网监
控系统大数据的统计模型,挖掘出了其中隐藏的数据间相互关系,
并与高速公路车辆超限、站点拥堵问题相结合进行了分析。
研究中采用山东省高速公路联网监控系统数据进行挖掘:建
立数据仓库,初步挖掘数据仓库以寻找基本规律,基于规律划定
建模大致方向,根据方向对数据仓库进行预处理,运用算法模型
对预处理后数据展开挖掘,在挖掘过程中不断对算法模型做出淘
汰、调整以确保可行,比较不同可行模型最终结果选取最优者进
行分析。
本文得到以下结论:
1.超限车辆行为规律:(1 )山东省内超限车辆主要是跨省
运送货物进入山东的集装箱货车,进入方式有两种:通过高速公
路直接进入和通过海港进入;(2 )山东省出省超限车辆数远小于
入省超限车辆数,一定程度上反映了山东省经济发展对省外物资
的需求强烈程度;(3)分析了超限车出现的高峰时段和主要位臵。
2.收费站点的关联性规律:山东省车流量最大的收费站—
—青岛东所经过的车辆主要对周围行驶时间半径一小内的 7 个
站点产生影响,并计算了影响的传播速度。
本文的主要价值在于:
1.大胆尝试了大数据与统计的结合,在大数据环境中运行
了多种传统算法模型,其过程和结果都为如何在统计工作中应用
大数据提供了重要参考。
2.挖掘数据虽局限于一省,但其方法完全可以拓展至全国,
研究的过程和结论都为提升高速公路管理效率提供了崭新的思
路。
关键词:高速公路 大数据 数据挖掘 聚类 关联
引言
交通运输是国民经济运行的大动脉,连接着社会生产、分配、交
换和消费等多个环节。高速公路是保障交通运输畅通无阻的重要通道。
但近年来高速公路货运车辆的运输超限、站点拥堵已严重地影响了高
速公路的畅通运行,而且这两个问题互相联系:站点查处超限车辆加
重了拥堵程度;拥堵加重又进一步降低了高速公路运输效率,车主的
超限意愿增大。交通管理部门对这两类问题进行过多次大力度的整治,
但一直以来由于治理手段有限,往往是成本大,收效小,因此,如何
找到科学有效管理超限车辆、避免站点拥堵的方法是交通运输管理的
难题。
根据本次统计建模大赛强调的重点——研究大数据在统计工作
中的应用,本小组针对上述问题,建立了多种模型对我司目前掌握的
大数据——高速公路联网监控系统原始记录数据展开了不预设目的
的数据挖掘,希望挖掘结果能对高速公路超限车辆有效管理和避免站
点拥堵有所启发。大数据建模经历了使用原始数据建立数据仓库,对
数据规律进行初步挖掘并确定建模基本方向,根据建模需要对数据仓
库进行预处理,运用算法模型对预处理后数据展开挖掘,在挖掘过程
中不断对算法模型做出淘汰、调整以确保可行,比较不同可行模型最
终结果选取最优者进行分析。
一、高速公路的特征、现状和问题
(一)高速公路的定义和特征
中国交通运输部《公路工程技术标准》规定,高速公路指“能适
应年平均昼夜小客车交通量为25000 辆以上、专供汽车分道高速行驶、
并全部控制出入的公路”。高速公路具有高速、安全、土地利用率和
通行能力高等主要特征,对于调整优化产业结构及分布、促进区域经
济发展和空间格局演化、提高资源配置效率等具有重要意义。高速公
路的建设情况可以反映一个国家和地区的交通发达程度,乃至经济发
展的整体水平。
各国高速公路里程一般只占公路总里程的 1-2%,但其所担负的
运输量占公路总运输量的20-25%。 高速公路行车速度高,通行能力
大,交通事故率小,是经济发展的必然产物。高速公路的问世缩短了
人们之间的时空距离。
(二)我国高速公路的发展和现状
2013 年末,全国高速公路里程达 10.44 万公里,比上年末增加
0.82 万公里。其中,国家高速公路7.08 万公里,增加0.28 万公里。
1
全国高速公路车道里程46.13 万公里,增加3.67 万公里。
图1 2009-2013 年国家高速公
大数据模型研究报告pdf_高速公路大数据模型研究.PDF相关推荐
- 大数据模型研究报告pdf_业绩大数据分析报告模型
文案大全 营销总经理的业绩数据分析模型--营销总经理的工作模型(一) 前言 营销总经理这个职位压力大而且没有安全感-- 天气变化. 竞品动态. 本品产品质量. 公司的战略方向. 费用投入. 经销商的突 ...
- 大数据模型研究报告pdf_大数据模型与决策课程案例分析报告
数据模型与决策课程案例一 生产战略 一.问题提出 好身体公司( BFI )在长岛自由港工厂生产健身练习器械.最近他们设计了两种针对家庭锻 炼所广泛使用的举重机. 两种机器都是用了 BFI 专利技术, ...
- 分享|雄安新区2021年大数据研究报告(附PDF)
内容摘要 百度智能云.百度商业智能实验百度云发布<雄安新区2021年大数据研究报告>,报告基于百度大数据.人工智能技术,采用"城市发展-政府 形象-民意脉动"三位一体城 ...
- 计算机成绩统计优秀率,基于决策树算法的成绩优秀率分析与研究.pdf
基于决策树算法的成绩优秀率分析与研究.pdf · · EraNo.122015 70 Computer DOI:10.166448.cnki.cn33-1094/tp,2015.12,019 基于决策 ...
- linux 网卡驱动 优化,Linux多核环境网卡驱动优化研究①.PDF
Linux多核环境网卡驱动优化研究①.PDF 2014 年 第 23 卷 第 10 期 计 算 机 系 统 应 用 Linux 多核环境网卡驱动优化研究① 姚萌萌, 张 俊, 沈 亮 (无锡江南计算技 ...
- 2021中国智能驾驶核心软件产业研究报告:软件定义,数据驱动.pdf(附下载链接)...
大家好,我是文文,今天给大家分享亿欧智库于2021年7月份发布的干货报告<2021中国智能驾驶核心软件产业研究报告:软件定义,数据驱动.pdf>,汽车赛道及关注智能驾驶的伙伴们别错过了. ...
- 【报告分享】2021中国智能驾驶核心软件产业研究报告:软件定义,数据驱动.pdf(附下载链接)...
大家好,我是文文,今天给大家分享亿欧智库于2021年7月份发布的干货报告<2021中国智能驾驶核心软件产业研究报告:软件定义,数据驱动.pdf>,汽车赛道及关注智能驾驶的伙伴们别错过了. ...
- 【白皮书分享】2020胡润大健康白皮书-胡润百富.pdf(附下载链接)
大家好,我是文文(微信:sscbg2020),今天给大家分享盈康一生和胡润百富于2020年8月份发布的报告<2020胡润大健康白皮书-胡润百富.pdf>. 在政策.市场.技术等共同作用下, ...
- 恒丰银行基于大数据平台构建数据仓库的研究与实践
恒丰银行原传统数据仓库是建立在IOE(IBM.ORACLE.EMC)传统架构体系上,已接入数据源系统有30多个,配套建立监管数据集市.数据分析集市,风险数据集市三个主要数据集市,负责十几个管理应用和监 ...
最新文章
- Ubuntu14.04 64位机上配置OpenCV3.4.2+OpenCV_Contrib3.4.2+Python3.4.3操作步骤
- 小型企业的上网行为管理方案
- 进阶:案例六: Context Menu(静态 与 动态)
- 关于并查集的个人再次的理解
- 【2021杭电多校赛】2021“MINIEYE杯”中国大学生算法设计超级联赛(10)签到题2题
- 使用shell/python获取hostname/fqdn释疑(转)
- iOS import,include和class的区别
- npm publish发布包时出现403错误no_perms Private mode enable, only admin can publish this module:
- 手动脱壳-熊猫烧香病毒-FSG v2.0
- 无盘 电影服务器,网吧电影服务器解决方案完全攻略指南
- 微信小程序给用户发红包
- 2018213969 冉雨晨 对cookie与session的了解
- 基于STM32F407标准库串口DMA+空闲中断
- Pip/python-如何查看已安装的包有哪些版本?如何查看某个包存在哪些版本?pip list-pip freeze-pip show package
- Java 中多态的概念以及前提条件
- Linux GPIO操作分析 - Exynos 5260
- (笔记)andro studio ——ProgressDialog
- 2022第七届少儿模特明星盛典 全国总决赛精彩直击
- 多个label,可变长情况下使用Masonry
- laya 怎么生成签名_手写签名在线生成器一笔签-手写签名在线生成器微信
热门文章
- matlab波带片程序,Matlab编程快速实现振幅型菲涅尔波带片的设计
- 信美相互与蚂蚁金服联合推出“相互保” 探索相互保险新玩法
- 对高校体育App的研究(三)【终】
- ODOO 12 设置公司基本信息
- nginx配置一个Ip多端口多站
- CPU密集型、数据密集型与IO密集型
- 预测明天什么股能涨起来,预测明天什么股能涨停
- js去掉前后空格的函数_MySQL 中常见的字符串函数应用详解
- 2022年全球市场水果去皮机和榨汁机总体规模、主要生产商、主要地区、产品和应用细分研究报告
- 基于Springboot+mybatis+mysql+html图书管理系统