原文链接   http://tecdat.cn/?p=1614

In order to solve the problem of safety accidents in production and life, we can use the current rapid development of DM (Data Mining) technology to realize the accident prediction of the monitoring system through the multi-dimensional analysis of the accident information, improve the performance of the monitoring system and form the safety warning mechanism.

Accident prediction requires meaningful and reliable information, and a large number of raw information flows must be analyzed and processed during the crisis.

Based on the above background, tecdat researchers focus on the collection of accident information data and analyze the relevant information, through the time, place, semantic and other different dimensions of the analysis of valuable information, and try to machine learning method to predict the occurrence of the accident.

▍时间维度事故分析

通过时间维度(日期和时间)的事故分析,我们可以洞察到不同类型的事故发生的高峰时间和高发月份,从而进行有效预防。

通过对结果的可视化,可以发现不同时间和月份的事故发生率有一定的差异,因此在后续的预测模型中可以构建相应的时间伪变量从而提高精度。

▍不同事故类型

通过对所有事故数据类型的占比分析,我们可以发现出行的事故发生率是最高的,也远远高于其他类型,其次是触电事故等。(注:部分事故重属多个类型)

▍事故报告语义分析

通过对事故报告的语义分析,我们可以发现报告中频繁出现的关键词,从中洞察到某类事故发生后通常会关联到哪些关键词,分析其背后的原因,从而进行有效的预防。

▍安全事故预测模型

在获得事故的不同维度基本特征之后,我们通过SVM算法使用这些特征来预测不同类型的事故发生的可能性,采取有针对性的措施,避免未知事故发生带来的损失,达到补救的效果。

▍技术

SVM(Support Vector Machine)用于构建、验证和测试数据集的模型。

在Spark / MLLib / Scikit-Learn / HDFS中重构实现处理较大的数据集。

▍结果

模型预测精度精度达到82.5%。

拓端tecdat|基于数据挖掘SVM模型的pre-incident事故预防预测分析报告相关推荐

  1. 拓端tecdat荣获掘金社区入驻新人奖

    2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...

  2. 拓端tecdat荣获2022年度51CTO博主之星

    相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...

  3. 基于离散Markov模型的Web用户行为预测算法的研究

    目录 一.理论基础 二.案例背景 1.问题描述 2.思路流程 三.部分MATLAB程序 四.仿真结论分析 五.算法相关应用 六.参考文献 一.理论基础 对于 Kth -Markov 模型,常见的建模算 ...

  4. 【大数据分析专业毕设之基于python爬虫的电影票房大数据预测分析+大屏可视化分析

    [大数据分析专业毕设之基于python爬虫的电影票房大数据预测分析+大屏可视化分析-哔哩哔哩https://b23.tv/saIKtBH flask web框架,数据使用requests模块爬取数据, ...

  5. 机器学习:基于多项式贝叶斯对蘑菇毒性分类预测分析

    基于多项式贝叶斯对蘑菇毒性分类预测分析 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

  6. 数据分析:基于K-近邻(KNN)对Pima人糖尿病预测分析

    数据分析:基于K-近邻(KNN)对Pima人糖尿病预测分析 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

  7. 拓端tecdat|bilibili视频流量数据潜望镜

    最近我们被客户要求撰写关于bilibili视频流量的研究报告,包括一些图形和统计输出. 最新研究表明,中国有超过7亿人在观看在线视频内容.Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个 ...

  8. 基于逻辑回归的金融风控贷款违约预测分析(笔记)

    一.背景与思路 (一)背景 核心问题:对贷款偿债能力的评估 1. 方法:利用逻辑回归(理解简单,可解释性强) 2. 信用评分卡的构建 金融风控 定性分析 逻辑回归 定量分析 信用评分卡 (二)流程 1 ...

  9. 市场调研—全球及中国细胞模型行业研究及十四五规划分析报告

    [报告篇幅]:122 [报告图表数]:164 [报告出版时间]:2021年1月 报告摘要 2019年,全球细胞模型市场规模达到了xx亿元,预计2026年可以达到xx亿元,年复合增长率(CAGR)为xx ...

  10. 论文笔记1《基于ID3决策树改进算法的客户流失预测分析》

    <计算机科学> 2010年 部分摘要:指出了该算法的取指偏向性以及运算效率不高等缺点,在此基础上提出了改进的ID3算法,该算法通过引入先验知识度参数,有效克服ID3算法中的取值偏向性和运算 ...

最新文章

  1. ios收货地址三级联动选择
  2. solaris11学习必用工具及ISO
  3. android setContentView()
  4. MyEclipse8.5注册码 到2015年
  5. 推荐算法 之协同过滤
  6. 由萧何出名想到的……数据中心运维思考
  7. Git学习笔记:Git简介
  8. iOS13 已越狱 iOS12.4 已越狱
  9. python json是什么_python json详解
  10. 我的一些学习经验:WIFI
  11. check_mk自定义监控增加性能数据图形展示
  12. ubuntu安装nividia驱动
  13. 计算机通信网自学笔记(1)
  14. 互联网已到中年,下一个产业革命是?
  15. rtl8188etv无线网卡驱动移植
  16. swiper修改轮播图下面小圆圈样式
  17. Arduino实验十四 无源蜂鸣器与有源蜂鸣器
  18. java后端获取支付宝会员的基本信息
  19. Android使用Mob开发平台免费短信验证
  20. 深入解析数据库透明加密技术

热门文章

  1. Android学习笔记--项目框架介绍
  2. LYNC2013部署系列PART7:TMG部署
  3. Mysql备份策略-完成备份+增量备份shell
  4. 今天就来分享一招坐着减肥法~ 办公室“久坐族”也同样适用
  5. 进程切换与线程切换的区别
  6. 一篇文章掌握MySQL事务的四大特性
  7. 机器学习资料合计(一)
  8. 第二季-专题12-通过按键玩中断
  9. VC Ping IP的类
  10. 交互设计中的“所见即所得”原则